STT 실시간 엔진 배포 가이드 및 데이터셋 전처리 현황

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1007. 2024-04-03.md

Summary

이 노트는 STT(음성인식) 실시간 엔진의 구성 요소와 Kubernetes/Docker 기반 배포 프로세스를 설명하는 교육 자료의 개요를 담고 있다. 폐쇄망 여부, k8s 환경 존재 여부, 이중화 필요성, Istio/Envoy 사용 여부, GPU 운영 환경 등 조건에 따른 설치 및 설정 플로우차트를 제시한다. 또한 일본어 YouTube 데이터셋의 전사 작업 진행률과 누락된 파일 확인, 애노테이션 타입 분류에 대한 초기 고민을 기록하고 있다.

Key Points

  • STT 엔진 구성: Engine, Management, Training(SIMS) 모듈로 구성
  • 배포 전제 조건: 모델 파일, Helm 차트, GPU 노드 드라이버 및 NVIDIA Container Toolkit 준비
  • 조건부 배포 플로우: 폐쇄망(라이선스 서버), k8s vs Docker-compose, 이중화(Replica/LB), Service Mesh(Istio/Envoy), GPU Operator 설치 여부
  • 데이터셋 현황: 일본어 YouTube 데이터셋 전사 진행 중 (23,753/36,495), 누락된 annotation 파일 확인 및 ann_type_5 분류 기준 논의