2026-01-27 업무: 제로원 TTS, 일본어 ASR 개선, 두나무 유지보수

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1672. 2026-01-27.md

Summary

본 노트는 2026 년 1 월 27 일의 업무 일지로, 제로원 프로젝트의 TTS 및 프롬프트 관리, 일본어 ASR 모델 (주소, 번호, 가타카나) 개선 방안, 두나무 인스턴스 업데이트 지연 현황, 그리고 짧은 발화 데이터셋 생성 실험을 기록하고 있다.

Key Points

  • 제로원 프로젝트: 프롬프트 관리의 중요성 재인식, 배치 처리 효과 확인, Nemo text-processor/T5 모델 검토, AIHUB 텍스트 데이터 활용 계획
  • 일본어 ASR 개선: 주소/번호 모델 개선, ‘데스’ 처리 방식 변경 (전사 후 ITN 제거), 필러 문제 해결, 가타카나 전사 모델 개발 및 언어모델 서프레스
  • 두나무 프로젝트: 인스턴스 업데이트 지연, 협업 요청 시까지 현상 유지, 1/29 운영계 작업 예정
  • 데이터 엔지니어링: 짧은 발화/잡담 혼입 음성 데이터셋 생성을 위한 augmentation 전략 및 추출/생성 스크립트 실행