S2 리빌드 문서화 및 다국어 RTFx 측정 환경 구축

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1714. 2026-03-10.md

Summary

본 노트는 S2 시스템 리빌드 관련 문서 정리(GPT 5.4 기반 구조도 포함)와 다국어 RTFx 측정(juno)을 위한 작업 계획을 기록한다. 특히 Whisper 모델을 TensorRT-LLM(TRTLLM)으로 서빙하기 위한 기술적 세부사항(엔진 빌드, 체크포인트 변환, Triton Server 구성)과 관련 파일 경로, 스크립트 예시가 포함되어 있다. 또한 일본어 주소/번호 모델 개선 및 가타카나 전사 모델 개발 등 NLP 관련 개선 사항도 언급된다.

Key Points

  • S2 리빌드: GPT 5.4를 활용한 빌더 재정비 및 TTS, Batch, SIMS 등 구성 요소에 대한 문서화 진행
  • 다국어 RTFx 측정: Conformer, Punctuator, VAD 등 모델의 L40s 환경 변환 필요성 확인
  • Whisper TRTLLM 서빙: TensorRT-LLM 엔진 빌드 및 INT8 양자화 체크포인트 변환 스크립트 기록
  • Triton Server 구성: Encoder/Decoder 디렉토리 구조 및 mel_feature_extraction 등 전후처리 모듈 통합 필요
  • NLP 모델 개선: 일본어 주소/번호 모델의 ‘데스’ 처리 방식 변경 및 가타카나 전사 모델 개발 계획