두나무 ITN 이슈 및 재전사 싱크 문제 분석

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1391. 2025-04-21.md

Summary

두나무 프로젝트의 ITN 개발 환경 이슈(영문자 활성화, PII 제거 등)와 성능 테스트(Grafana 배포) 진행 상황을 기록함. 핵심 문제는 재전사 시 실시간 스트림과 녹취 파일 간 시간 동기화 오류로, 이는 G.723.1 코덱 변환으로 인한 오디오 특성 변화와 VAD 모델의 확률적 오차가 복합적으로 작용하여 발생함. 해결 방안으로 손실이 적은 코덱(OPUS) 사용 또는 STT 입력 전 코덱 변환 검토를 제안함.

Key Points

  • ITN 개발계 이슈 해결: 영문자 활성화, skip_alphabet 제거, PII 제거 완료
  • 성능 테스트 인프라 구축: Grafana(포트 1860, 22515) 및 Service Monitor 배포
  • 재전사 싱크 문제 원인: 실시간 LINEAR16 WAV와 재전사용 G.723.1 MP3 간 오디오 특성 차이로 인한 VAD(start_at) 오차
  • 해결 방안: 녹취 저장 코덱을 OPUS 등 손실 압축이 적은 형식으로 변경하거나, STT 입력 전 코덱 변환 검토
  • 후속 조치: VGW 디버그 로그 분석 및 녹취 서버 담당자와 개선 방안 논의 예정