2025-12-10 업무: STT 패키징, VAD 필터링, 및 인프라 개편

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1624. 2025-12-10.md

Summary

본 노트는 2025 년 12 월 10 일의 업무 진행 상황을 기록한 일일 노트이다. 주요 주제는 ‘웰컴용’ STT 솔루션의 패키징 (Helm 차트, Stack Builder 개선), VAD(Voice Activity Detection) 노이즈 필터링 기술 검토 (DeepFilterNet, Pronaia 엔진), 그리고 현대캐피탈 프로젝트의 ITN 갱신 및 파이프라인 설정이다. 또한, 장기적인 모델 서빙 및 컴파일 프로세스 자동화 (Ansible, SIMS) 에 대한 구상과 퇴직연금 (DC) 관련 개인 메모가 포함되어 있다.

Key Points

  • STT 솔루션 패키징: rtzr-stt pacman 개선, Helm 차트 수정, Stack Builder 의 이미지 동기화 및 노드 제어 (hosts.yaml) 개편 논의
  • VAD 및 오디오 처리: DeepFilterNet 검토 (48kHz 제한 사항), Pronaia 엔진을 이용한 간이 필터 구현, VAD postprocessor 의 고루틴 및 컨텍스트 문제점 분석
  • 프로젝트별 진행: 현대캐피탈 (ITN 갱신, Triton 이미지 업데이트, VAD Postprocessor 미완료), 두나무/MWW 인스턴스 업데이트 완료
  • 인프라 및 디버깅: VITO worker 디버깅 (Redis 기반), Triton-ITN tokenizer(Grapheme decoder) 관련 PR 병합
  • 장기 로드맵: sims-trainer 를 통한 다중 모델 (VAD, ITN, PII) 지원, Ansible 기반 모델 컴파일 및 배포 자동화, 단일 모델 기반 서빙 구조로 통합
  • 기타: 퇴직연금 (DC) 제도 및 삼성증권 운용 관련 개인 메모