Day 265: Vito-Kaldi 디코더 구조 분석 및 오프라인 디코딩 미완료

Source

  • Field Notes/ReturnZero/Daily Notes/Day 265. 2022-03-22.md

Summary

2022년 3월 22일(265일차) 일지. Patrick과 HifiGAN 논의는 진행되었으나, 오프라인 디코더 코딩은 피로와 주의 산만으로 미완료되었다. 주요 기술적 활동으로 vito-kaldi의 디코더 초기화, response_loop(비동기 큐 기반), CPU/CUDA 파이프라인 흐름을 분석하며 DecodeTask와 쓰레드워커의 관계를 혼란스러워했다. 또한 Sommers v4.03 대비 디토크나이징 이슈(UNIT_kg 등)가 발생하여 NLP 팀 대응 중이며, EKS 세팅도 진행 중이었다. 기존 Kaldi 파이프라인(0-11 단계)을 재검토하며 훈련 단계 위주임을 확인했다.

Key Points

  • 오프라인 디코더 코딩 목표는 피로/주의산만으로 미달성
  • vito-kaldi 디코더 구조 분석: response_loop(비동기), DecodeTaskManager, CPU/CUDA 파이프라인 흐름 확인
  • DecodeTask와 쓰레드워커의 역할 구분에 대한 기술적 혼란 존재
  • 디토크나이징 버그: UNIT_kg가 UNIT Kg로 언더바 제거됨 (NLP 팀 대응)
  • 기존 Kaldi 파이프라인(0-11) 재검토: 데이터 준비부터 SAT 훈련까지의 단계 확인