S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-04)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1708. 2026-03-04.md

Summary

본 노트는 ‘S2 리빌드’ 프로젝트의 스택빌더(StackBuilder) 작업 진행 상황과 문서화 체크리스트를 기록하고 있다. 주요 이슈로는 일본어 ASR 모델의 주소/번호 전사 개선(데스 처리 방식 변경, 필러 문제), 가타카나 전사 모델 개발, 그리고 한국어 짧은 발화 훈련이 있다. 또한 S2 솔루션의 온프레미스 설치 매뉴얼과 커리큘럼 퍼블리시를 위한 기술 문서 검증 목록을 상세히 나열했으며, 폭허스 미팅 관련 비즈니스 개편 논의 내용도 일부 포함되어 있다.

Key Points

  • S2 리빌드: 스택빌더 작업 완료, 매뉴얼 및 문서 정리 진행 중
  • 일본어 ASR 개선: 주소/번호 모델의 ‘데스’ 처리를 전사 후 ITN 제거 방식으로 변경, 가타카나 전사 모델 개발 및 언어모델 서프레스 작업
  • 한국어 ASR: 짧은 발화 훈련 진행
  • S2 온프레미스 설치: sims-root 데이터 준비, 커리큘럼 용어 분류, 설치 매뉴얼 및 기술 정확성 검증용 문서 목록 정리
  • 인프라/모델 관리: Triton ITN 모델 소스(GitHub)와 아티팩트(MinIO) 분리 관리, Sims Prefix Decoder 및 Cronjob 이슈 확인
  • 비즈니스: 폭허스 미팅에서 BM/모바일 개편 및 실시간 노트 기능 강화 등 전략 논의