ReturnZero STT 솔루션 개발 및 모델 레지스트리 구조화

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1632. 2025-12-18.md

Summary

이 노트는 ReturnZero(STT 솔루션)의 일상 업무 진행 상황과 모델 관리 인프라 구축 현황을 기록한 것이다. 주요 이슈로는 웰컴용 트랜스레이터 패키징, VAD 필터링, 일본어/한국어 ASR 모델 개선(특히 ITN 처리 방식 변경), 그리고 TTS 서빙 준비가 있다. 핵심적인 구조적 변화는 NFS 기반의 ‘모델 레지스트리’ 도입으로, 기존 산발적인 모델 관리를 task/family/interface/version의 4단계 계층 구조로 체계화하여 배포용 패키징 자동화를 목표로 하고 있다. 또한 NFS 디렉토리 구조와 개인 개발 환경 설정에 대한 기술적 참고 사항이 포함되어 있다.

Key Points

  • ReturnZero STT 솔루션의 웰컴용 패키징 및 다국어(일/한) 모델 성능 개선 작업 진행 중
  • 일본어 ITN(Inverse Text Normalization) 처리 방식 변경: 데스(Death) 문제를 전사 후 ITN 단계에서 제거하는 방식으로 전환
  • NFS 기반 모델 레지스트리 도입: 배포 효율화를 위해 모델을 task, family, interface, leaf-version 4단계로 계층화하여 관리
  • 모델 레지스트리 구조: interface는 입출력 호환성을 기준으로 구분하며, manifest.yaml을 통해 배포 구조 명시
  • NFS 디렉토리 구조: /nfs/train(연구/개발 데이터), /nfs/archive(불변 데이터)로 구분하여 연구자 간 데이터 공유 지원
  • 향후 목표: 모델 패키징 자동화 및 Triton Server 서빙 환경 최적화