ReturnZero Day 1623: STT 파이프라인 개선 및 인프라 자동화

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1623. 2025-12-09.md

Summary

이 노트는 ReturnZero 프로젝트의 STT(음성인식) 파이프라인 최적화(VAD 필터, Grapheme decoder, ITN)와 Kubernetes 기반 배포 자동화(Pacman, Helm 차트, Stack Builder) 진행 상황을 기록한 일일 업무 노트입니다. 주요 이슈로는 VAD NF 필터 시험, 번호판 모델 ITN 개발, 그리고 Helm 업그레이드 중 발생한 Gateway 손실 복구 실수가 포함됩니다. 또한, 일본어 데이터 정제 방법론과 말소리 디버깅 필요성, 그리고 장기적인 모델 서빙 및 컴파일 자동화(Ansible, SIMS) 방향성을 제시합니다.

Key Points

  • STT 파이프라인 구성 요소(VAD, ASR, ITN)의 구현 및 검증 진행 중이며, 특히 VAD NF 필터와 Grapheme decoder가 리뷰 대기 상태임.
  • Kubernetes 배포 자동화를 위한 ‘Pacman’ 및 ‘Stack Builder’ 도구 개선 작업 중이며, Helm 차트 검증 및 이미지 동기화 문제 해결 필요.
  • 신한카드 프로젝트에서 Helm upgrade 실수로 인한 Gateway/VirtualService 손실 및 복구 경험 기록.
  • VITO worker 디버깅을 위한 Redis 기반 테스트 환경 구성 절차 명시.
  • 장기적으로 SIMS trainer를 통한 다양한 모델(VAD, Neural ITN 등) 지원 및 Ansible 기반 모델 컴파일/서빙 자동화 목표 설정.
  • 일본어 데이터 정제(시풋) 및 말소리 디버깅이 향후 해결 과제임.