TMN 회의: 일본어 4자리 숫자 인식 오류 분석

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1093. 2024-06-28.md

Summary

TMN 회의에서 일본어 음성 인식 모델의 4자리 숫자 인식 오류를 분석했다. 전체 오답 중 약 13.3%(86건)가 4자리 숫자 관련 오류였으며, 그중 2%(13건)가 심각한 오류로 분류되었다. 주요 오류 유형은 숫자 자릿수 혼동(예: 70→720), 발화 미인식(특히 ‘천’ 단위), 그리고 가독성 저하로 인한 오인식이다. 향후 데이터 확인 및 CER(문자 오류율) 분석을 통한 개선이 필요함을 확인했다.

Key Points

  • 일본어 음성 인식에서 4자리 숫자 인식이 주요 약점임
  • 전체 오답 중 13.3%가 4자리 숫자 관련 오류
  • 주요 오류 패턴: 자릿수 혼동, ‘천’ 단위 미인식, 발화 불명확 시 오인식
  • 향후 작업: 4자리 숫자 발화 CER 분석 및 오답 건수 정량화
  • 일반 모델 배포 및 코드 엔진 추가 요건 논의