ReturnZero Day 1645: 모델 레지스트리 및 웰컴용 STT 패키징 진행

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1645. 2025-12-31.md

Summary

2025-12-31 기준 ReturnZero 프로젝트의 일일 업무 기록이다. 핵심 과제로 모델 레지스트리 정리(ONNX, Triton 템플릿), 웰컴용 translator 패키징(rtzr-stt-solution-stack-builder, 차트 개선), 그리고 일본어/한국어 모델 개선(짧은 발화, 주소/번호 모델, 데스 처리 규칙 변경)이 있다. 또한 SIMS 파일 암호화, worker 디버깅, 두나무 인스턴스 업데이트 준비, Junkrat 장비 복구(Rocky 9.7) 및 Pacman 인계 관련 리포지토리 확인이 포함된다. 장기적으로는 sims-trainer 지원 확대, 모델 서빙 단순화, Ansible 기반 모델 컴파일 자동화를 계획하고 있다.

Key Points

  • 모델 레지스트리: ONNX 모델 카드 및 Triton 템플릿 정리 완료, 빌더 스크립트 및 convert_tensorrt.sh 수정 필요
  • 웰컴용 STT 패키징: rtzr-stt-solution-stack-builder 개선(pre-commit, 테스트 통합), 차트 수정, 다국어 지원 불필요 판단 및 Gemma2 27b 번역기 도입
  • 모델 개선: 한국어 짧은 발화 훈련, 일본어 주소/번호 모델 개선(데스 전사 후 ITN에서 제거 방식 변경)
  • 인프라 및 보안: SIMS 파일 암호화, worker 디버깅, 두나무 인스턴스 업데이트(협업 요청 대기 중), Junkrat 장비 Rocky 9.7 설치 및 접속 문제
  • 장기 계획: sims-trainer(VAD, Neural ITN, PII 등) 지원, 단일 모델 기반 서빙 구조화, Ansible을 통한 모델 컴파일 및 배포 자동화