ITN 서비스 배포 및 VAD 통합 구성 검토

Source

  • Field Notes/ReturnZero/Daily Notes/Day 664. 2023-04-25.md

Summary

이 노트는 ReturnZero 프로젝트의 ITN(Inverse Text Normalization) 서비스를 Kubernetes 환경에 배포하고, 기존 VAD(Voice Activity Detection) 모델과 Triton 서버에서 함께 실행하는 구성을 검토하는 과정이다. 소음 데이터 처리 방식 개선(구간 기반 합치기)과 함께, 테스트 환경 설정(pytest 실패 해결), Docker Compose 상태 확인, 그리고 Arthur와의 협의를 통한 pharah 서버에서의 테스트 계획 및 릴리즈 브랜치 전략을 기록하고 있다.

Key Points

  • 소음 데이터 처리: 에너지 기반 VAD와 단순 합치기의 한계를 인지하고 구간 기반 처리로 전환 필요성 확인
  • ITN 서비스 배포: Kubernetes Helm charts(pronaia)를 통해 worker 및 triton_neural_itn 리소스 구성 검토
  • 모델 통합: Triton 서버에서 VAD와 ITN 모델을 동시에 로드(modelPath)하여 실행하는 방식 고려
  • 테스트 환경 문제: pytest 실패 원인(ITN 주소 부재) 해결을 위해 환경변수 처리 또는 pharah 서버 활용 방안 모색
  • 협업 및 배포: Arthur와의 의견 교환을 통해 release 브랜치에 ITN 리팩토링 내용 포함 및 pharah 서버에서의 테스트 진행 계획