2026-03-25 업무 및 기술 이슈 요약

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1729. 2026-03-25.md

Summary

이 노트는 2026 년 3 월 25 일의 업무 일지로, 일본어 음성 인식 (ASR) 모델 개선 (VAD, 짧은 발화, 가타카나, 데스/필러 처리) 과 VAD 문제 해결을 위한 데이터셋 구축 계획이 핵심이다. 또한 EKS 클러스터 버전 업그레이드 (1.33->1.35) 관련 인프라 설정 변경 사항과 NVIDIA GPU Operator 업그레이드 가이드가 기록되어 있다.

Key Points

  • 일본어 ASR 개선: VAD 개선, 짧은 발화 훈련, 주소/번호 모델 개선 (데스 전사 후 ITN 제거, 필러 처리), 가타카나 전사 모델 개발 및 언어모델 서프레스.
  • VAD 문제 해결: 현대캐피탈 및 신한은행 다국어 환경 이슈 대응을 위해 Primary Voice Isolation 데이터셋 생성 (secondary speaker amplitude 스케일링, RIR 어그먼테이션).
  • 인프라 업그레이드: EKS 1.33 에서 1.35 로 업그레이드 시 ArgoCD, Helmfiles 구성 요소 확인 및 NVIDIA GPU Operator 업그레이드 시 runtimeClassName 설정 필요.
  • 기타 업무: 한국어 짧은 발화 훈련, 제로원 TTS TN, 웰컴 주시 등 진행 중.