2026-02-19 업무: 일본어 ASR/TTS 개선 및 S2 리빌드

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1695. 2026-02-19.md

Summary

본 노트는 2026 년 2 월 19 일의 업무 일지로, 일본어 음성 인식 (ASR) 및 합성 (TTS) 모델의 품질 개선과 내부 시스템 ‘S2’의 리빌딩 작업이 주요 화제입니다. 일본어 모델에서는 ‘데스 (desu)‘와 같은 필러 처리 전략 변경 (전사 후 ITN 제거), 주소/번지수 모델 개선, 가타카나 전사 모델 개발이 핵심 이슈입니다. 또한 S2 리빌드를 위한 커리큘럼 준비와 데이터 정제, TTS 정규화 데이터셋 확장 작업이 진행 중이며, 네트워크 포트 리다이렉션 등 인프라 설정 사항도 기록되어 있습니다.

Key Points

  • 일본어 ASR/TTS 모델 개선: ‘데스’ 처리 방식 변경 (전사 유지 후 ITN 에서 제거), 주소/번지수 모델 정교화, 가타카나 전사 모델 개발
  • TTS 정규화 작업: 프롬프트 개선 확인 후 데이터셋 규모 5 만 개로 확대 계획
  • S2 리빌드 프로젝트: 커리큘럼 생성 및 리뷰, A-RAG 도입을 통한 데이터 정제 시도, 관련 인프라 (sims-k8s 등) 용어 정리
  • 인프라 및 기타: gRPC/Websocket 브리지 연결 유지성 검토, iptables/firewalld 를 이용한 포트 리다이렉션 (443->30443 등) 설정
  • 일정: 다음 주 초 (2/2~2/3) 일본어 데이터셋 확정 및 훈련 계획