S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-13)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1717. 2026-03-13.md

Summary

본 노트는 S2 시스템 리빌드(문서화, 구조도 정리)와 일본어 ASR 모델 개선(주소, 번호, 가타카나 전사 및 데스/필러 처리 전략 변경)을 주요 업무로 기록하고 있다. 또한 SIMS 배치 처리를 위한 Docker Compose 및 API 호출 예시 코드, 환경 변수 설정 등 기술적 구현 세부사항을 포함하고 있다.

Key Points

  • S2 리빌드: GPT 5.4 기반 빌더 재정비 및 TTS, Batch, SIMS(agenda, admin, eval, audit, db) 구조도 문서화 진행 중
  • 일본어 ASR 개선: 주소/번호 모델 개선, 가타카나 전사 모델 개발 및 언어모델 서프레스 적용
  • 전사 전략 변경: ‘데스’ 처리를 기존 무시에서 전사 후 ITN 단계에서 제거하는 방식으로 변경, 필러 문제 해결 시도
  • SIMS 배치 처리: WFST 실행을 위한 TRITON_E2E_TYPE 설정 및 Docker Compose 기반 배치 서비스 구동 방법 기록
  • 기타 업무: IBK A100 모델 준비, 제로원 TTS TN, 한국어 짧은 발화 훈련 등