Triton-Kaldi 디코딩 파이프라인 분석 및 Sommers 후처리 장애

Source

  • Field Notes/ReturnZero/Daily Notes/Day 204. 2022-01-20.md

Summary

본 노트는 Triton-Kaldi 백엔드에서 i-vector 추출 시점(온라인 vs 오프라인)과 디코딩 큐(outstanding vs preprocessing)의 차이를 코드 레벨에서 분석한 기록이다. 또한 Sommers 후처리 도구(rt-tokenizer) 적용 시 Python 버전 불일치 및 Docker 환경 설정 문제로 인한 실행 장애를 기록하고 있다.

Key Points

  • Triton-Kaldi 백엔드에서 use_online_features_ 플래그에 따라 i-vector/MFCC 계산 경로가 달라짐 (온라인: outstanding_utt_ 큐, 오프라인: preprocessing_utt_queue_ 큐).
  • Triton 클라이언트 측에서 청크 전송 간격을 조절하여 온라인 디코딩을 시뮬레이션하는 방식 확인.
  • Sommers 후처리용 rt-tokenizer 로컬 실행 실패 (Python 버전 문제) 및 Docker화 과정에서의 GitHub 토큰 설정 번거로움 기록.
  • Lattice 기반 평가 시 답안지(text)의 기호 정수화 및 토크나이저 적용 방법에 대한 의문점 제기.