ASR 모델 성능 평가 결과 (2023-10-02)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 823. 2023-10-02.md

Summary

2023년 10월 2일 기록된 음성 인식(ASR) 모델의 테스트 결과입니다. 숫자, 영숫자, 한자, 가타카나 등 다양한 문자 유형별 CER(Character Error Rate)과 SER(Sentence Error Rate)을 비교 분석하였으며, 가타카나와 숫자 영역에서 상대적으로 낮은 오류율을 보였습니다. 또한 PyTorch 체크포인트를 ASR ckpt 형식으로 변환하는 명령어 실행 기록이 포함되어 있습니다.

Key Points

  • 다양한 문자 유형(숫자, 영숫자, 한자, 가타카나)에 대한 ASR 모델 성능 지표(CER, SER, RTFx) 비교
  • 가타카나(katakana)와 숫자(number) 테스트에서 상대적으로 낮은 CER(5~7%) 기록
  • 한자(kanji) 및 영숫자(alphanumber) 테스트에서 높은 SER(49~57%) 확인
  • PyTorch 모델 체크포인트(.pt)를 ASR 전용 형식(.ckpt)으로 변환하는 스크립트 실행 기록