rtzr-stt Pacman 개선 및 VAD 필터 기술 검토

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1611. 2025-11-27.md

Summary

본 노트는 rtzr-stt 프로젝트의 Pacman(Whisper/Translator) 차트 개선, KISA R&D망 서버 설치, 그리고 VAD(Voice Activity Detection) 필터링 기술(DeepFilterNet 등) 검토를 중심으로 한 일일 업무 기록이다. 특히 Helm 차트 구조 개편(solution-values/config 분리), 모델 서빙 및 컴파일 프로세스 표준화, 그리고 브라우저 기반 DNN 모델 앱(transformer.js)에 대한 기술적 배경 조사가 포함되어 있다.

Key Points

  • rtzr-stt Pacman 차트 개선: FasterWhisper/TensorRT 비교 및 stack builder 동기화 개선
  • Helm 차트 구조 개편: solution-values와 solution-config 분리, SIMS/SSO 설정 통합
  • VAD 필터 기술 검토: DeepFilterNet(48kHz 제한) 및 Pronaia engine 기반 간이 필터 구현 계획
  • KISA R&D망 서버 환경 구축: Docker registry secret 발급 및 PV/PVC 생성
  • 장기적 모델 관리 전략: SIMS trainer 확장, 모델 컴파일 자동화(Ansible), 단일 모델 기반 서빙 구조
  • 브라우저 기반 DNN 기술 조사: transformer.js 기반 WhisperWeb/Kokoro TTS 분석