2026-05-28 업무 및 기술 이슈 요약

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1793. 2026-05-28.md

Summary

본 노트는 2026 년 5 월 28 일의 업무 일지로, Primary Voice Isolation(PVI) 모델의 성능 개선 시도 (MiniMossFormer2 훈련 실패 및 Loss 함수 조정) 와 일본어 ASR 모델의 다양한 전사 오류 (데스, 필러, 주소/이름/숫자 인식 문제) 해결 방안을 기록하고 있다. 또한 현대카드 및 화물맨 프로젝트의 SIMS/언어모델 대응 현황과 인턴 면접 (코딩 테스트, C/Python 평가) 결과를 포함한다.

Key Points

  • PVI: MiniMossFormer2 훈련 중 Loss 함수 다듬기 시도했으나 성능 저하 발생. Teacher 모델과의 CER 격차 10% 이내 목표 설정.
  • 일본어 ASR 개선: 데스 (desu) 전사 후 ITN 에서 제거 전략, 필러 삭제, 주소 (번지수) 및 이름 (성/이름 분리) 인식 오류 해결 필요.
  • 일본어 모델 개발: 가타카나 전사 모델 개발 및 언어모델 서프레스 검토. Qwen3 ASR 벤치마킹 계획.
  • 프로젝트 현황: 현대카드는 SIMS 초벌학습 후 비활성화, 화물맨은 추가 코퍼스 기반 언어모델 학습 예정.
  • 인턴 면접: 행렬 초기화, WER/Levenshtein 거리 이해도, C/Python 실력 평가 진행.