화물맨 ASR 도메인 특화 및 일본어 모델 개선 현황

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1773. 2026-05-08.md

Summary

본 노트는 화물맨(MWW) 프로젝트의 상용 배포를 앞두고 ASR 성능 개선을 위한 도메인 특화 코퍼스 구축 과정과, 일본어 ASR 모델의 주소/번호/이름 인식 오류 해결 방안을 기록한 업무 일지이다. 화물맨 프로젝트에서는 주소, 운송 정보, ID 코드 인식을 위해 실제 고객 데이터와 합성 데이터를 혼합한 대규모 코퍼스를 구성했으며, 일본어 모델은 ‘데스(Desu)’ 처리 방식 변경 및 필러 제거, WFST 기반 이름 모델 개선 등을 주요 과제로 삼고 있다.

Key Points

  • 화물맨 ASR 도메인 특화: 주소, ID 코드, 운송 도메인 용어를 포함한 합성 및 실제 데이터 기반 코퍼스 구축 완료 (주소 1200만 라인+, 코드 69만 라인+, 도메인 발화 115만 라인+).
  • 일본어 ASR 개선 과제: ‘데스’ 전사 후 ITN 제거 방식 도입, 필러(간투어) 삭제, 주소 번지수 인식 오류 해결, 성/이름 분리 인식 문제 해결을 위한 WFST 코퍼스 재구성.
  • Primary Voice Isolation(PVI): 성능 개선을 위한 디스틸레이션(DeepFilterNet3) 및 Pronaia 엔진 리샘플러 필터화 수정 진행 중.
  • 벤치마킹: Qwen3 ASR 모델을 Whisper 대비 벤치마킹 예정.