2026-05-14 업무 및 기술 이슈 요약

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1779. 2026-05-14.md

Summary

본 노트는 2026 년 5 월 14 일의 업무 진행 상황과 기술적 이슈를 기록한 일일 노트입니다. 주요 관심사는 Primary Voice Isolation(PVI) 모델의 성능 검증 (DeepFilterNet3), 일본어 ASR 모델의 개선 (주소, 번호, 가타카나 전사 및 데스/필러 처리), 그리고 MWW 화물맨 프로젝트의 배포 및 테스트 환경 구축입니다. 특히 일본어 모델에서 성/이름 분리 인식 오류, 숫자 전사 오류 (2E 등), 주소 번지 인식 문제 등을 해결하기 위한 WFST 및 데이터셋 개선 방안을 논의하고 있습니다.

Key Points

  • PVI(Primary Voice Isolation): DeepFilterNet3 검증 및 pronaia-engine 리샘플러 필터화 수정 진행 중. 평가 지표 (CER/WER) 비교 데이터 기록.
  • 일본어 ASR 개선: 주소 (번지수), 번호 (데스 소거 및 전사 전략 변경), 가타카나 전사 모델 개발, 필러 (간투어) 삭제 등 전반적 품질 개선 목표.
  • 일본어 이름 모델: 성/이름 분리 인식 오류 해결을 위해 WFST 코퍼스 재구성 (성 + 이름 + 성_이름) 및 prefix decoder 모델 검토.
  • MWW 화물맨: 25.01 버전 배포 준비 및 T4 인스턴스 테스트 진행. 메모리 부족으로 인한 오류 발생 시 pin memory 조정 (2GB -> 512MB) 대응.
  • 기타: 제로원 TTS TN 보고서 작성 및 gitlab 문의, dadumi 버그 수정, 한국어 짧은 발화 훈련 등.