S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-19)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1723. 2026-03-19.md

Summary

본 노트는 S2 프로젝트 리빌드 관련 문서화 및 빌더 환경 구축(k8s, docker-compose) 진행 상황을 기록하고 있다. 주요 기술적 이슈로는 일본어 ASR 모델의 주소/번호 인식 개선(특히 ‘데스’ 처리 방식 변경 및 필러 문제), 가타카나 전사 모델 개발 및 언어모델 서프레스 작업이 명시되어 있다. 또한 제로원 TTS TN, IBK, 웰컴 주시 등 다양한 프로젝트의 주간/일일 할 일 목록을 포함하고 있다.

Key Points

  • S2 리빌드: 매뉴얼 및 문서 정리, 빌더 스크립트 및 k8s 환경 검증 완료
  • SIMS: docker-compose 전환 작업 진행
  • 일본어 ASR 개선: 주소 모델(데스, 번지수), 번호 모델(데스 전사 후 ITN 제거, 필러 처리), 가타카나 전사 모델 개발
  • 기타 프로젝트: 제로원 TTS TN(Matt), IBK 주시(Salt), 웰컴 주시(Sunday) 진행 중
  • 한국어 짧은 발화 훈련 지속