모델 레지스트리 구조화 및 배포 자동화

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1636. 2025-12-22.md

Summary

이 노트는 산발적으로 관리되던 AI 모델(ASR, VAD, ITN 등)을 체계적으로 관리하기 위한 ‘모델 레지스트리’ 도입 배경과 4단계 구조(task/family/interface/version)를 정의한다. 배포 환경(NVIDIA GPU, Triton Server) 최적화를 위한 패키징 자동화를 궁극적 목표로 하며, 현재 진행 중인 웰컴용 솔루션 패키징, 일본어 모델 개선, VAD 필터 시험 등 구체적인 업무 이슈와 장기적인 Ansible 기반 컴파일 자동화 계획을 포함한다.

Key Points

  • 모델 레지스트리 도입 목적: 각 Lab 간 산발적 관리로 인한 이력 추적 어려움 해소 및 배포용 패키징 효율 제고
  • 레지스트리 4단계 구조: task(작업 단위) -> family(모델 종류) -> interface(입출력 호환성 기준) -> leaf-version(실제 파일 및 manifest.yaml)
  • 배포 자동화 목표: 모델 버저닝 관리 및 Triton Server 템플릿화를 통해 패키징 및 컴파일 과정 자동화
  • 현재 주요 이슈: 웰컴용 translator 패키징(rtzr-stt), 일본어 주소/번호 모델 개선, VAD NF 필터 시험, 두나무 인스턴스 업데이트
  • 장기 계획: Ansible을 활용한 모델 컴파일 및 배포 자동화, Sims-trainer를 통한 다양한 모델 변환 지원