ReturnZero Day 832: 일본어 인식 실험 및 Prefix Decoder 평가

Source

  • Field Notes/ReturnZero/Daily Notes/Day 832. 2023-10-11.md

Summary

2023-10-11 기준 ReturnZero 프로젝트의 일본어 음성 인식 실험 노트입니다. Prefix decoder 도입이 오히려 성능 저하(중간 생략, 문자 반복 오류)를 초래하여 v4 버전 추이를 지켜보며 결정하기로 했습니다. 또한 학습 데이터에서 구분자 | 제거의 영향과 타겟 도메인 데이터 부재 시 incremental 학습의 한계, 한국어 ‘오뚜기’ 상품명 인식 이슈를 기록했습니다. 실험 결과로 hiragana, kanji, number, alphanumber 등 다양한 테스트 세트의 CER/SER 지표가 나열되어 있습니다.

Key Points

  • Prefix decoder는 중간 생략 및 문자 반복 오류로 인해 효과가 미미하거나 부정적임
  • 구분자 | 제거 학습 및 v4 버전 성능 추이 관찰 필요
  • 타겟 도메인 데이터 없이 incremental 학습 시 발생하는 문제점 확인
  • 한국어 ‘오뚜기’ 상품명 인식 관련 이슈 발생
  • 다양한 문자셋(hiragana, kanji, number 등)에 대한 CER/SER 벤치마크 데이터 기록