일본어 ASR 모델 디버깅 및 성능 비교 (Day 704)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 704. 2023-06-04.md

Summary

일본어 음성 인식(ASR) 모델 학습 및 평가 과정에서 발생한 하이드라(Hydra) 설정 오류, 가중치 변환 문제, 파일 권한 오류 등을 해결하는 과정을 기록함. TTS 모듈 포함/미포함 모델 간의 성능(CER, RTF)을 비교 평가함.

Key Points

  • Hydra 설정에서 model.encoder.model 인스턴스화 오류 발생 및 해결 과정 기록
  • 체크포인트(.pt)에서 .ckpt로의 가중치 변환 필요성 확인
  • 평가 데이터셋 오류로 인한 높은 CER(89.3%) 발생 후, 올바른 데이터셋으로 재평가
  • NFS 파일 시스템 권한 오류(PermissionError) 발생 및 해결
  • TTS 포함 모델(CER 5.43%)과 TTS 미포함 모델(CER 5.49%) 간 성능 비교 결과 기록
  • Docker 환경 설정 및 의존성 설치 순서 정리