mel2vec 영숫자 인식 성능 검증 및 패딩 실험 결과

Source

  • Field Notes/ReturnZero/Daily Notes/Day 905. 2023-12-22.md

Summary

2023-12-22 기준 mel2vec 기반 영숫자 인식 모델의 성능 검증 및 패딩(Padding) 전략 실험 결과를 기록한 일일 노트입니다. ONNX/Trt 컴파일 완료 후 sommers-e2e 테스트 환경에서 영숫자(Alphanumeric) 및 숫자(Number) 데이터셋에 대한 CER(Character Error Rate)과 RTFx(Real-Time Factor)를 측정했습니다. 주요 발견사항으로, 패딩 마스크 적용 시 CER이 1.13%에서 1.21%로 미세하게 증가하여 성능 저하가 관찰되었으며, 영숫자 인식 CER은 약 3.07%, 숫자 인식 CER은 약 0.22% 수준으로 확인되었습니다.

Key Points

  • mel2vec 모델의 영숫자 및 숫자 인식 성능 검증 완료 (ONNX/Trt 컴파일 포함)
  • sommers-e2e 테스트 결과: 영숫자 CER ~3.07%, 숫자 CER ~0.22%
  • RTFx 성능: 약 170~216 범위에서 측정 (하드웨어/환경 의존적)
  • 패딩 실험: 패딩 마스크 적용 시 CER이 1.13% -> 1.21%로 증가 (성능 저하)
  • 오류 분석: 삽입(ins), 삭제(dels), 치환(subs) 세부 지표 기록