2026-02-25 업무: 일본어 STT/TTS 모델 개선 및 S2 리빌드

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1701. 2026-02-25.md

Summary

본 노트는 2026년 2월 25일의 업무 일지로, 주요 초점은 일본어 음성 인식(STT) 및 합성(TTS) 모델의 성능 개선에 맞춰져 있다. 구체적으로 ‘데스(desu)‘와 같은 종결어미의 전사 및 ITN(Inverse Text Normalization) 처리 정책 변경, 필러(filler) 제거, 가타카나 전사 모델 개발, 주소 및 번지수 인식 개선 등을 다룬다. 또한 짧은 발화 데이터 수집과 TTS 샘플 생성을 통한 데이터 증강 작업이 진행 중이며, S2 프로젝트의 리빌드(커리큘럼 준비, 노션 자동화, packer 버그 수정)와 관련 문서 퍼블리싱 준비 사항도 기록되어 있다.

Key Points

  • 일본어 STT 모델 개선: ‘데스’ 처리 방식 변경(전사 후 ITN에서 제거), 필러 문제 해결, 가타카나 전사 모델 개발
  • 데이터 엔지니어링: 짧은 발화 데이터 수집, TTS를 활용한 증강 데이터 생성, vocab 재계산 및 pysommers화 진행
  • 주소/번호 모델: 번지수와 호실 구분(쉼표 활용) 등 주소 모델 개선 및 번호 모델의 데스/필러 이슈 대응
  • S2 리빌드: 커리큘럼 준비(용어 분류), 노션 자동화 방안 모색, packer 버그 수정 및 대시보드화
  • 문서화: S2 관련 설치 매뉴얼 및 커리큘럼 문서의 기술 정확성 검증 및 퍼블리싱 네비게이션 준비