2026-01-20 업무: 제로원 TTS 데이터 정제 및 일본어 STT 모델 배포 가이드

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1665. 2026-01-20.md

Summary

본 노트는 2026년 1월 20일의 업무 기록으로, ‘제로원’ 프로젝트의 TTS 데이터 정제 코드 개발 및 빌드 과정에서의 어려움, 그리고 일본어 STT 모델의 개발계/운영계 배포 구조와 가이드 작성 현황을 다룹니다. 특히 일본어 모델의 주소/번호 인식 개선(데스/필러 처리)과 가타카나 모델 개발 계획, 두나무 인스턴스 유지보수 등이 주요 이슈로 기록되어 있습니다.

Key Points

  • 제로원 TTS: 데이터 정제 코드(pysommers) 개발 및 빌드 스크립트 실험 진행 중이나, 결과물이 기대만큼 만족스럽지 않음.
  • 일본어 STT 모델 개선: 주소/번호 모델의 데스(음성 휴지) 전사 후 ITN 제거 전략 변경, 필러 문제 해결, 가타카나 전사 모델 개발 및 언어모델 서프레스 계획.
  • 일본어 모델 배포 가이드: 개발계(SIMS 관리용)와 운영계 간의 모델 위치 차이 및 배포 프로세스(트라이톤 리포지토리 복사, AM/LM 버전 관리)에 대한 상세 구조 정리.
  • 기타 업무: 두나무 인스턴스 업데이트 보류(협업 요청 대기), worker dynamic narg 변경 리뷰 대기.