주소 인식 모델 (Address Model) 성능 분석 및 트러블슈팅

Source

  • Field Notes/ReturnZero/Daily Notes/Day 952. 2024-02-08.md

Summary

2024 년 2 월 8 일 일일 작업 기록으로, 주소 인식 (ASR) 모델의 성능 최적화 과정과 인프라 이슈를 다룹니다. 주요 내용으로는 Sommers 모델에서 패딩 제거 시 성능 개선 효과 확인, ONNX/Triton 기반 동적 형태 (dynamic shape) 모델 설정, 프록시 서버 장애로 인한 유튜브 다운로더 중단, 그리고 특정 테스트셋 (mww_test_0915_kanji) 에서의 CER/SER 평가 결과 (CER 11.52%, SER 55.48%) 가 포함됩니다.

Key Points

  • 주소 인식 모델 분석 중 Sommers 모델의 패딩 제거 시 오디오 전체 구간 처리로 성능 향상 확인
  • ONNX Triton 모델 (RTX3090_N2302_PRONAIA_E2E_JPN_ADDRESS) 의 동적 형태 (dynamic shape) 활성화 및 관련 config 설정
  • 유튜브 다운로더 실행 중 프록시 서버 장애 발생
  • Docker-compose 설정 변경 (pronaia-engine 이미지 업데이트)
  • 테스트 결과: mww_test_0915_kanji 데이터셋에서 CER 11.52%, SER 55.48% 기록