ReturnZero Day 1762: PVI 및 일본어 ASR 개선 현황

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1762. 2026-04-27.md

Summary

본 노트는 ReturnZero 프로젝트의 일일 업무 기록으로, Primary Voice Isolation(PVI)의 로직 및 성능 개선과 일본어 ASR(Address, Number, Name) 모델의 정제도를 높이기 위한 구체적인 이슈(데스 소거, 필러 제거, WFST 구조 조정 등)를 다룬다. 또한 Pronaia on-premise 배포 차트 및 관련 엔진의 PR 정리 현황을 기록하고 있다.

Key Points

  • Primary Voice Isolation(PVI): 로직 개선과 ONNX 품질/메모리 확보가 주요 과제.
  • 일본어 ASR 개선: 주소(번지수), 번호(데스 소거 및 ITN 처리), 이름(WFST 구조 재정의) 모델의 정확도 향상을 위한 데이터셋 확보 및 모델 수정 진행 중.
  • 기타 업무: 짧은 발화 훈련, ZeroOne TTS TN, Dadumi 버그 수정, Pacman 관련 작업.
  • 배포 및 인프라: Pronaia on-premise chart 및 engine 관련 다수 PR 병합 완료.
  • 다국어 배포 지원: Chart 및 rtzr 관련 상황 점검.