2026-01-21 업무: 제로원 TTS 데이터 정제 실패 및 일본어 STT 모델 개선 계획

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1666. 2026-01-21.md

Summary

본 노트는 2026 년 1 월 21 일의 업무 일지로, ‘제로원’ 프로젝트의 TTS 데이터 정제 코드 실행 및 결과 불만족, 일본어 STT 모델 (주소, 번호, 가타카나) 의 개선 방향 (데스 처리 변경, 필러 문제 등) 및 배포 프로세스 (S3 패키징, 차트 Git 관리) 를 기록하고 있다. 또한 두나무 프로젝트의 운영 주체 부재 및 MSA 미적용 문제, 현대캐피탈 STT 작업 현황 확인 등 다른 프로젝트의 이슈도 포함한다.

Key Points

  • 제로원 TTS: 데이터 정제 코드 (pysommers) 실행 및 gold 데이터 생성 시도했으나 결과에 만족하지 못함.
  • 일본어 STT 개선: 주소/번호 모델 개선 필요성 대두. 데스 (death) 처리를 기존 무시에서 전사 후 ITN 에서 제거로 변경, 필러 문제 해결, 가타카나 전사 모델 개발 및 언어모델 서프레스 계획.
  • 일본어 배포 프로세스: 개발환경에서 모델 패키징 후 S3 업로드, 운영환경에서 다운로드 및 차트 Git 으로 버전 관리하는 방식 채택.
  • 두나무 프로젝트: 운영 주체 부재, 권한 할당 문제, MSA 미적용이 주요 이슈로 지목. 유지보수 논의 예정.
  • 현대캐피탈: 1 월 말까지 예정된 STT 작업의 반영 시기 및 특이사항 확인 요청.