ReturnZero Day 1644: 모델 레지스트리 구축 및 웰컴용 STT 패키징

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1644. 2025-12-30.md

Summary

2025-12-30 일일 업무 노트로, ReturnZero 프로젝트의 모델 레지스트리(MinIO 기반) 구축과 웰컴용 STT 솔루션 패키징(rtzr-stt-solution-stack-builder) 진행 상황을 기록함. 주요 완료 사항으로는 ONNX/TensorRT 모델 변환 스크립트 수정, Triton 템플릿 정리, TTS 차트 생성 및 SIMS k8s 테스트가 있음. 미완료 및 향후 과제로는 VAD NF 필터 시험(Pronaia engine), SIMS 파일 암호화, 일본어 번호 모델의 ‘데스’ 처리 로직 변경, 두나무 인스턴스 업데이트 협업 등이 있음. 또한 장기적으로 Ansible을 통한 모델 컴파일 자동화 및 다국어 지원 구조 개선에 대한 고찰을 포함함.

Key Points

  • 모델 레지스트리 구축: MinIO를 사용하여 ONNX, PyTorch 모델 및 Triton 템플릿을 버전별/아키텍처별로 체계적으로 보관하는 구조 확립.
  • 웰컴용 STT 패키징: rtzr-stt-solution-stack-builder 프로젝트에서 pre-commit 도입, 테스트 환경(online/batch/whisper) 통합, TensorRT 변환 스크립트 최적화 진행.
  • TTS 서빙 및 차트: TTS 차트 생성 완료 및 SIMS k8s 환경에서 테스트 수행. 번역 모델로는 Gemma2 27b를 sglang으로 구동 계획.
  • 언어 모델 개선 사항: 일본어 번호 모델에서 ‘데스’를 기존 무시 방식에서 전사 후 ITN에서 제거하는 방식으로 로직 변경 검토.
  • 미완료 및 향후 과제: Pronaia-engine 기반 VAD PP 테스트, SIMS 파일 암호화, worker 디버깅, 두나무 인스턴스 업데이트(협업 요청 대기 중).
  • 장기 비전: Ansible을 활용한 모델 컴파일 및 배포 자동화, 단일 모델 기반의 다중 CC 모델 선택 구조로 전환하여 배포 효율성 제고.