ReturnZero Day 1652: STT/ITN 개선 및 제로원 착수 준비

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1652. 2026-01-07.md

Summary

2026-01-07 일일 업무 노트로, 한국어 짧은 발화 훈련과 일본어 주소/번호 모델 개선(특히 ‘데스’ 처리 방식 변경)을 주요 기술 이슈로 다룬다. 또한 rtzr-stt-solution-stack-builder의 빌드 환경 문제, SIMS 파일 암호화, worker 디버깅 등 인프라 및 도구 개선 사항과 ‘제로원’ 프로젝트 착수 준비를 기록하고 있다.

Key Points

  • 일본어 STT 모델 개선: ‘데스(Death)’ 토큰을 기존 무시 방식에서 전사 후 ITN(Inverse Text Normalization) 단계에서 제거하는 방식으로 변경 결정.
  • 한국어 짧은 발화 훈련 진행 중.
  • rtzr-stt-solution-stack-builder: pre-commit 도입, 온라인/배치/Whisper 통합 테스트 환경 구축 시도(빌드 실패 시 머신 문제 의심).
  • 번역 파이프라인: Gemma2 27b 모델을 sglang을 통해 직접 실행하여 다국어 번역 처리.
  • 인프라 및 운영: SIMS 파일 암호화, worker 디버깅, 두나무 인스턴스 업데이트 보류(협업 요청 시 대응), packer 자동 모델 변환 기능 개발.
  • 프로젝트 관리: ‘제로원’ 프로젝트 착수 체크리스트 확인 및 대비.