ReturnZero STT/TTS 인프라 개선 및 웰컴저축은행 프로젝트 킥오프

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1610. 2025-11-26.md

Summary

2025-11-26 일일 업무 기록으로, 웰컴저축은행(STT/TTS) 프로젝트 킥오프(하드웨어 L40s, 모델 prefix decoder m2v250m, 보안 이슈)와 기존 rtzr-stt Pacman/차트 개선(Stack builder 동기화, solution-values 구조화, SIMS 통합)을 다룹니다. 또한 VAD 필터(DeepFilterNet) 시험, 인-브라우저 DNN 모델(transformer.js) 조사, 장기적인 모델 서빙/컴파일 자동화(Ansible) 방향성을 제시합니다.

Key Points

  • 웰컴저축은행 프로젝트 킥오프: L40s GPU 환경 구성, prefix decoder m2v250m 모델 채택, 클라이언트 SDK 보안(Auth) 대응 필요성 확인
  • rtzr-stt Pacman/차트 개편: Stack builder 이미지 동기화 강화, solution-values 기반 차트 제어 구조화, SIMS 설정 통합(admin, sso 등)
  • VAD 및 오디오 처리: DeepFilterNet3 시험 계획, 48kHz 오디오 제한 사항 확인, Grapheme decoder 구현 예정
  • 장기 로드맵: Sims-trainer를 통한 다양한 모델(VAD, ITN, PII) 지원, Ansible 기반 모델 컴파일/배포 자동화, 단일 모델 기반 다중 선택 구조화
  • 기술 조사: WhisperWeb, Kokoro TTS 등 인-브라우저 DNN 앱 분석 및 transformer.js 기술 배경 검토