Triton-Kaldi 통합 테스트 및 팅커벨 사전 기능 설계 (Day 231)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 231. 2022-02-16.md

Summary

이 노트는 Kaldi 모델을 Triton Inference Server 환경에 통합하며 발생한 메모리 누수 및 WER(단어 오류율) 문제를 분석한 기록이다. 특히 테스트 데이터셋을 ‘record 단위’ 대신 ‘segment 단위’로 변경해야 함을 깨닫는 과정과, 리스코어링(Rescoring) 적용 계획을 담고 있다. 또한 ‘팅커벨’이라는 내부 도구의 단어사전 자동 검색 기능 요구사항과 Python의 contextlib.ExitStack을 이용한 defer 패턴 학습 내용을 포함한다.

Key Points

  • Triton-Kaldi 통합 테스트 중 메모리 누수 및 성능 저하 이슈 발견
  • 테스트 데이터셋 오류: record 단위(대용량) 대신 segment 단위(소용량) 사용 필요성 확인
  • 다음 단계: 리스코어링 적용 및 WER 개선 보고 준비
  • 팅커벨(Tinkerbell) 단어사전 기능: Notion/Terms 검색 연동 및 이모지 피드백 기반 TODO 자동화 요구사항 정의
  • Python contextlib.ExitStackfunctools.partial을 활용한 자원 관리(defer) 패턴 학습