2026-02-20 업무: 일본어 ASR/TTS 모델 개선 및 S2 리빌드

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1696. 2026-02-20.md

Summary

본 노트는 2026 년 2 월 20 일의 업무 일지로, 일본어 음성 인식 (ASR) 및 합성 (TTS) 모델의 성능 개선을 위한 데이터 정제 및 전사 전략 변경 (특히 ‘데스’ 처리 방식) 이 핵심이다. 또한 S2 프로젝트 리빌드를 위한 커리큘럼 준비 및 인프라 문제 (OpenSSL 호환성, 네트워크 복구) 해결 과정이 기록되어 있다.

Key Points

  • 일본어 모델 개선: 주소/번호 모델의 ‘데스’ 처리를 전사 후 ITN 에서 제거하는 방식으로 변경하고, 필러 및 가타카나 전사 모델 개발을 진행 중.
  • TTS 데이터 생성: 짧은 발화 자연스러움을 위한 데이터셋 생성 및 정규화 (Normalizer) 작업, CTC 증강 데이터 제작.
  • S2 리빌드: A-RAG 도입을 통한 데이터 정제 시도 및 사내 인프라 (sims-k8s 등) 관련 커리큘럼 용어 분류 작업.
  • 인프라 이슈: Rocky 9.4 에서 OpenSSL 3.5.5 호환성 문제로 인한 네트워크 장애 발생 및 복구 과정 기록.