2026-01-16 업무: 두나무 STT 연동 장애 및 일본어 모델 개선

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1661. 2026-01-16.md

Summary

본 노트는 2026 년 1 월 16 일의 업무 기록으로, 두나무 프로젝트의 STT(음성인식) 시스템 연동 장애 해결 과정과 일본어 음성 모델 개선 방향을 다룹니다. 두나무 측에서는 IP 변경으로 인한 도메인 재설정 및 라우팅 문제 (IPCC-STT 연결 끊김), SIMS 의 Okta 인증 오류 등을 겪으며 네트워크 구성 (ALB/NLB, 대상그룹) 을 점검했습니다. 일본어 모델 관련해서는 ‘데스 (death)‘음성의 전사 정책 변경 (전사 후 ITN 에서 제거), 필러 처리, 가타카나 전사 모델 개발 및 서프레스 전략을 논의했습니다. 또한 제로원 프로젝트의 코드 리뷰 및 데이터 정제 작업도 병행했습니다.

Key Points

  • 두나무 STT 연동 장애: IP 변경으로 인한 도메인 재설정 후 IPCC-STT 재연결 실패 및 라우팅 문제 (Route53 직접 연결 vs 대상그룹 바인딩 부재) 확인.
  • 두나무 네트워크 구성: UCS-VGW, SIMS-VGW 연결은 정상이나, STT 관련 대상그룹 (7220 포트) 의 Unhealthy 상태 및 NLB/ALB 혼재 구조 확인.
  • SIMS 인증 오류: Okta 변경 후 ‘denied the request’ 오류 발생, default 설정 복원으로 일시 해결.
  • 일본어 모델 개선 방향: ‘데스’음성 처리를 기존 무시에서 ‘전사 후 ITN 에서 제거’로 정책 변경, 필러 문제 해결, 가타카나 전사 모델 개발 및 언어모델 서프레스 검토.
  • 제로원 프로젝트: matt 데이터 정제 코드 (pysommers) 작업 및 코드 리뷰 진행.