ReturnZero Day 1651: 업무 현황 및 제로원 TTS TN 정책 정의

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1651. 2026-01-06.md

Summary

2026-01-06 일일 업무 노트로, Pacman 프로젝트 인계 완료 및 제로원(ZeroOne) 프로젝트의 TTS Text Normalization(TN) 정책 수립을 위한 셀프 킥오프 내용을 담고 있다. 주요 이슈로는 일본어 STT 모델 개선(데스 처리 방식 변경), SIMS 파일 암호화, worker 디버깅 등이 있으며, 제로원 프로젝트의 핵심 산출물인 spec.md 초안 작성과 0(영/공) 정책, 범위(~) 읽기 정책, 한자 변환 정책 등 TN 규칙의 기본 원칙을 정의했다.

Key Points

  • Pacman 프로젝트 인계 완료: rtzr-stt-solution-stack-builder 레포지토리 및 관련 차트, MinIO 설정 등을 salt/junkrat에게 전달함.
  • 제로원 TTS TN 정책 정의: infotainment용 on-device 실시간 TTS를 위한 텍스트 정규화 규칙 수립.
  • 핵심 TN 규칙 결정: 1) 0(영/공) 정책(코드/전화번호는 ‘공’, 일반 숫자는 ‘영’), 2) 범위(~) 읽기 정책(‘A부터 B까지’), 3) 한자→한글 정책(고유명사 whitelist 기반 변환 또는 원문 유지).
  • 출력 형식 원칙: 의미 추가 금지, 숫자/부호/단위 변형 금지, 불확실 시 원문 유지(fallback).
  • 기타 기술 이슈: 일본어 STT에서 ‘데스’를 전사 후 ITN에서 제거하는 방식으로 변경, SIMS 파일 암호화, worker dynamic narg 변경 리뷰 대기.
  • 인프라/도구: rtzr-stt-solution-stack-builder에 pre-commit 도입, Gemma2 27b를 sglang로 띄워 번역 수행, packer 자동 모델 변환 기능 개발.