Day 238. 2022-02-23

Source

  • Field Notes/ReturnZero/Daily Notes/Day 238. 2022-02-23.md

Summary

Rescorer 구현을 위해 Triton Kaldi 파이프라인에 BigLMRescore 모듈을 통합하는 과정에서의 기술적 장애물과 디버깅 기록을 다룹니다. 초기 실험에서 CER 성능 변화가 미미하거나 오히려 악화되는 현상을 관찰했으며, 이는 모델 로딩 실패(undefined symbol)로 인해 실제 Rescore가 적용되지 않았음을 확인하며 해결했습니다. 주요 원인은 CMakeLists.txt에 소스 파일 누락 및 Kaldi 라이브러리 링크 문제였습니다.

Key Points

  • Rescorer 구현을 위해 lattice_postprocessor 파라미터로 LM 파일을 받도록 설계 시도
  • 초기 실험 결과: 적용 전 CER 24.29 → 적용 후 CER 24.31 (성능 개선 없음)
  • Triton Kaldi 모델 로딩 실패 발생: undefined symbol 오류로 인해 Rescore 모듈이 실제로 로드되지 않음 확인
  • 원인 분석: CMakeLists.txt에 rescore.h/cc 포함 누락 및 Kaldi ConstArpaLmDeterministicFst 심볼 링크 문제
  • 해결 방향: 빌드 설정 수정을 통해 공유 라이브러리 로딩 문제 해결 필요