RTZR-STT 모델 레지스트리 구조화 및 배포 자동화 계획

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1637. 2025-12-23.md

Summary

본 노트는 RTZR-STT 솔루션의 모델 관리 효율화를 위해 ‘모델 레지스트리(Model Registry)‘를 도입하고 구조화하는 과정을 기록한다. 기존 산발적인 모델 관리의 문제점(이력 부재, 비표준화)을 해결하기 위해 Task-Family-Interface-Version의 4단계 계층 구조를 제안하며, Triton Server 템플릿과 모델 카드(Model Card) 관리를 통한 배포 자동화를 장기 목표로 삼는다. 또한 VAD, ASR, ITN 등 주요 컴포넌트의 현재 이슈와 개선 사항(예: 일본어 모델 개선, SIMS 파일 암호화)을 정리하고 있다.

Key Points

  • 모델 레지스트리 도입 목적: 배포용 패키징 효율 제고 및 모델 이력 표준화
  • 레지스트리 구조: 1.Task(asr, vad 등) -> 2.Family(sommers, whisper 등) -> 3.Interface(입출력 shape/vocab 기준) -> 4.Leaf-Version(실제 파일)
  • 배포 자동화 목표: Ansible을 활용한 모델 컴파일 및 서빙 환경 구축
  • 현재 진행 중: 모델 카드 작성, Triton 템플릿 정리, VAD/ASR 모델 최적화
  • 기타 이슈: 일본어 주소/번호 모델 개선, SIMS 파일 암호화, 웰컴용 트랜슬레이터 패키징