2026-02-21 업무: 일본어 ASR/TTS 개선 및 S2 리빌드

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1697. 2026-02-21.md

Summary

본 노트는 2026 년 2 월 21 일의 업무 기록으로, 일본어 음성 인식 (ASR) 및 합성 (TTS) 모델의 품질 개선을 위한 데이터 정제 및 전사 전략 변경 (특히 ‘데스’ 처리 방식) 이 핵심이다. 또한 S2 프로젝트 리빌드를 위한 커리큘럼 준비 및 인프라 관련 문서화 작업, packer 버그 수정 등 다양한 기술적 이슈가 나열되어 있다.

Key Points

  • 일본어 ASR/TTS 모델 개선: 주소 및 번호 모델의 ‘데스’ 전사 후 ITN 제거 전략 도입, 가타카나 전사 모델 개발, 짧은 발화 훈련 데이터 생성.
  • S2 프로젝트 리빌드: A-RAG 도입을 통한 데이터 정제 시도, 사내 인프라 (sims-k8s, junkrat 등) 관련 커리큘럼 및 용어 정리.
  • 기타 기술 작업: packer 버그 수정 및 대시보드화, gRPC bridge 연결 유지성 검토, TTS 정규화 데이터셋 생성 프롬프트 조정.