일본어 ASR 모델 평가 및 rt-itn 배포 기록

Source

  • Field Notes/ReturnZero/Daily Notes/Day 807. 2023-09-15.md

Summary

2023-09-15 일자 필드 노트로, 일본어 음성 인식(ASR) 모델의 성능 평가 결과와 후처리 모듈(rt-itn)의 Docker 배포 절차를 기록하고 있다. 주요 내용은 relpos 기반 모델(v0, v1)의 CER(Character Error Rate) 비교 및 rt-itn 라이브러리의 editable 설치 방법이다.

Key Points

  • 일본어 ASR 모델 평가: relpos_ctc_alphanumber_v1 모델이 qoo10_test(5.57%), tedxjp(12.42%)에서 v0 모델 대비 CER 성능 개선 확인
  • 모델 가중치 변환: PyTorch checkpoint(.pt)를 Sommers E2E 프레임워크용(.ckpt)으로 변환하는 과정 및 관련 경고 메시지 기록
  • rt-itn 배포 절차: Docker 컨테이너(deploy-triton-1) 내 rt-itn 라이브러리의 버전 확인 및 editable 설치(pip install -e .) 스크립트
  • 원문 제목 불일치: 파일명은 ‘현대캐피탈 보안 패치’이나 실제 내용은 일본어 ASR 및 rt-itn 관련 기술 노트임