ASR 모델 개선 및 프로젝트 진행 현황 (2026-05-07)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1772. 2026-05-07.md

Summary

본 노트는 Primary Voice Isolation(PVI)의 ONNX 최적화 문제와 일본어 ASR 모델(주소, 번호, 가타카나)의 전사 오류 개선 방안을 다룹니다. 또한 MWW 화물맨 프로젝트의 상용 배포를 위한 도메인 특화 코퍼스 구축 필요성과 인텔 관련 인프라 이전 계획을 기록하고 있습니다.

Key Points

  • PVI: ONNX-TRT 변환은 완료되었으나 성능 저하 발생, 지식 증류(distillation) 검토 중
  • 일본어 ASR: ‘데스(です)’ 전사 후 ITN 제거 전략, 필러 삭제, 주소/번호 모델의 특정 발음 오류(2E, C 등) 개선 필요
  • 일본어 이름 모델: 성/이름 분리 인식 오류 해결을 위해 WFST 코퍼스 재구성(prefix decoder 모델)
  • MWW 화물맨: 5/21 상용 배포 예정, 운송 정보 포함 주소 발화 및 ID 인식 이슈 해결을 위한 도메인 특화 코퍼스 구축 필요
  • 인프라: 인텔 관련 서비스(Homura 등)의 을지로3가(유베이스) 사이트 이전 계획