RTZR 일본어 ASR 개발 이력 및 모델 레지스트리 구조

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1630. 2025-12-16.md

Summary

본 노트는 RTZR의 일본어 ASR(Sommers-ja) 모델 개발 이력(2021~2025)을 정리하고, 현재 진행 중인 업무 이슈(VAD 필터, SIMS 파일, 번역 패키징 등)를 기록한 일일 업무 노트이다. 특히 일본어 모델의 세분화(일반/주소/이름), 데이터 세그멘테이션 문제, 가타카나 전사 이슈 등 기술적 도전과 해결 과정을 상세히 기술하며, 배포 효율화를 위한 ‘모델 레지스트리’의 4단계 구조(task/family/interface/version)와 도입 배경을 설명한다.

Key Points

  • 일본어 ASR 모델(Sommers-ja)은 2021년 Kaldi 기반 개발을 시작으로 2025년 현재 SIMS 개발 및 배치 모델 배포 단계에 있으며, MWW 등 고객사 데이터 수집을 통해 지속적으로 개선됨.
  • 주요 기술적 이슈로 MWW 데이터의 루즈한 세그멘테이션, 가타카나 모델의 LM 편향 문제, VAD(Near-field) 필터링 등이 있으며, 이를 해결하기 위해 모델 세분화 및 데이터 정제 전략을 수립함.
  • 모델 레지스트리는 배포용 패키징 자동화를 위해 도입되었으며, task(예: asr), family(예: sommers), interface(입출력 shape/vocab 기준), version 의 4단계 계층 구조로 관리됨.
  • 현재 진행 중인 업무로는 웰컴용 트랜스레이터 패키징, VAD NF 필터 시험, 두나무 인스턴스 업데이트, 일본어 리뷰 등이 있음.