S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-02-27)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1703. 2026-02-27.md

Summary

본 노트는 2026 년 2 월 27 일의 업무 일지로, ‘S2 리빌드’ 프로젝트의 스택빌더 작업 완료 및 매뉴얼/문서 정리 진행 상황을 기록하고 있다. 또한 일본어 ASR 모델 개선 (주소, 번호, 가타카나 전사 및 ITN 처리 전략 변경) 과 한국어 짧은 발화 훈련, 제로원 TTS TN, IBK A100 모델 준비 등 다양한 NLP/ASR 관련 연구 및 개발 이슈를 나열하고 있다. S2 리빌드 매뉴얼 퍼블리시를 위한 필수 검증 문서 목록과 빌더 설정 (sims 모델, 스토리지, trt farm) 에 대한 메모가 포함되어 있다.

Key Points

  • S2 리빌드: 스택빌더 작업은 완료되었으나, 매뉴얼 및 문서 정리는 진행 중임.
  • 일본어 ASR 개선: 주소 모델 (데스, 번지수), 번호 모델 (데스 전사 후 ITN 제거 전략, 필러 처리), 가타카나 전사 모델 개발 및 언어모델 서프레스가 주요 과제임.
  • 기타 NLP/ASR 이슈: 한국어 짧은 발화 훈련, 제로원 TTS TN, IBK A100 모델 준비, 웰컴 주시 등이 언급됨.
  • S2 리빌드 문서화: 매뉴얼 퍼블리시 전 기술 정확성 검증을 위한 다수의 관련 문서 (솔루션 개요, 모듈 맵, 파이프라인, k8s 설치, SBOM 등) 목록이 제시됨.
  • S2 빌더 설정: sims 모델 복사, 스토리지 설정, trt farm 구성이 필요함.