ReturnZero Day 1791: PVI/일본어 ASR 이슈 및 UBase 타운홀 요약

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1791. 2026-05-26.md

Summary

본 노트는 ReturnZero 개발자의 업무 일지로, Primary Voice Isolation(PVI) 모델의 손실 함수 개선 실패와 일본어 ASR(주소, 숫자, 이름)의 전사 오류(데스 소거, 필러, 번지수 인식) 개선 방향을 기록한다. 또한 UBase 타운홀 내용을 통해 AI Agent 실서비스 타임라인(6~7월), PVA 팀의 AI 연구소 통합, 스톡옵션 정책 변경, 그리고 Callabo/S2/VITO 사업 전략을 정리한다.

Key Points

  • PVI: MiniMossFormer2 훈련 중 loss function 다듬기 시도했으나 실패, teacher 모델과의 CER 격차 10% 이내 목표 유지
  • 일본어 ASR 개선: 데스(음절말 자음) 전사 후 ITN 제거 전략, 필러 삭제, 주소 번지수/숫자 인식 오류(2E, 4->C 등) 해결 필요
  • 일본어 모델 개발: 가타카나 전사 모델 개발, 이름 모델의 prefix decoder 및 WFST 코퍼스(성+이름) 구축
  • UBase 타운홀: 6~7월 AI Agent 실서비스 목표, PVA 관련자 AI 활용 연구소 이전, CES 2027 Global SaaS AICC 목표
  • 조직/정책: 스톡옵션 성과 연동 설계(차주~2주 후 발표), Callabo 해외 진출 및 S2/VITO 자연성장 구조 전환