ReturnZero Day 1743: PVI, 일본어 ASR 개선 및 신한 SDK 빌드

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1743. 2026-04-08.md

Summary

본 노트는 ReturnZero 팀의 일일 업무 기록으로, Primary Voice Isolation(PVI) 평가 데이터셋 생성 및 MossFormer2 모델 테스트, 일본어 ASR의 데스(음절) 처리 및 주소/번호 모델 개선 과제, 신한은행 다국어용 윈도우 클라이언트 SDK 빌드 및 기본값 수정, 그리고 온콜 모니터링 업무를 다룬다.

Key Points

  • Primary Voice Isolation(PVI): MossFormer2 기반 필터 구현을 위해 ksponspeech 기반 평가 데이터셋 생성 코드 점검 및 테스트 진행.
  • 일본어 ASR 개선: 데스(음절) 전사 후 ITN에서 제거하는 방식으로 변경, 필러 삭제, 주소(번지수) 및 번호 모델의 정확도 향상 과제.
  • 신한은행 대응: 윈도우 클라이언트 SDK 빌드 완료, 샘플레이트 16000Hz 및 echo cancelation false 설정 적용.
  • 기타 업무: pronaia chart PR 병합, bulk_stt 수정, 온콜 모니터링 및 Pacman L4 파일 이상 검토.