Kaldi ASR 모델 테스트 환경 설정 및 초기 실행 문제

Source

  • Field Notes/ReturnZero/Daily Notes/Day 191. 2022-01-07.md

Summary

Kaldi ASR 모델(KsponSpeech 기반)의 테스트 환경 설정과 WER 계산 파이프라인 구축 과정을 기록함. Docker 마운트 설정, 데이터셋 경로(wav.scp) 지정, 소문자 변환(tr) 및 sym2int 유틸리티 사용법을 확인하며 테스트를 시도함. 그러나 한국어 모델에 영어 데이터를 입력하거나 데이터셋 경로 설정 오류로 인해 클라이언트 실행 중 ‘Waiting for all results’ 단계에서 중단되는 문제를 발견함.

Key Points

  • Kaldi ASR 테스트 파이프라인: launch_client.sh -> run_client.sh -> compute_wer.sh
  • Docker 환경에서 절대경로 대신 마운트 포인트를 통한 데이터 접근 필요성 확인
  • WER 계산 전처리: words.txt 소문자 변환(tr), sym2int.pn 을 통한 lattice-transcript 변환
  • 테스트 실패 원인: 데이터셋 경로(wav.scp) 설정 오류 및 언어 불일치(한국어 모델에 영어 입력)로 인한 클라이언트 행(hang) 문제
  • 사용 데이터셋: KsponSpeech_ra_do_ip/test_clean