ReturnZero Day 1745: PVI, 일본어 ASR 개선 및 Kubernetes 보안 검토

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1745. 2026-04-10.md

Summary

본 노트는 ReturnZero 프로젝트의 일일 업무 기록으로, Primary Voice Isolation(PVI) 모델의 로직 개선과 평가 데이터셋 구축, 일본어 ASR(주소/번호/이름)의 전사 오류(데스, 필러, 번지수) 해결 방안, 그리고 Pronaia 온프레미스 차트의 Kubernetes RBAC 보안 구조 분석 내용을 담고 있다.

Key Points

  • Primary Voice Isolation(PVI): MossFormer2 기반 필터 구현 완료 및 로직 개선 진행 중. Primary/Secondary 스피커 합성 데이터셋 구축.
  • 일본어 ASR 개선: 주소(번지수), 번호(데스 소거), 이름(WFST 구조) 전사 오류 해결 필요. 필러(간투어) 삭제 및 가타카나 모델 개발 계획.
  • Kubernetes 보안 검토(Pronaia): STT/TTS 차트의 ServiceAccount 및 RBAC 분석 결과, 기본값 기준 과도한 권한(ClusterRole 등) 부여 없음. SIMS agent는 네임스페이스 범위 내 제한적 권한만 보유.
  • 기타 업무: 신한 다국어용 윈도우 클라이언트 빌드 완료, 제로원 TTS TN, Pacman L4 파일 이상 검토.