Day 491: E2E 음성 인식 서버 배포 장애 및 Kaldi 대체안 검토

Source

  • Field Notes/ReturnZero/Daily Notes/Day 491. 2022-11-03.md

Summary

2022-11-03 일지. 프란의 리팩토링 진행 중이며, E2E 음성 인식 모델을 서버에 배포하는 과정에서 GPU 아키텍처 호환성 문제(Orisa 2080Ti vs 모델 3090 기반)로 실패함. Triton Inference Server 설정 오류(model not found, max batch)를 겪으며 Kaldi 기반 대체안으로 전환 검토 중. Moira 통신 문제도 발생.

Key Points

  • E2E 모델 서버 배포 실패: GPU 컴퓨트 아키텍처 불일치(Compute 8.6 vs 7.5)로 인한 호환성 문제.
  • Triton Inference Server 설정 오류: 모델 미등록(‘conformer_5_ensemble’) 및 max batch 설정 누락으로 인한 에러 반복.
  • 대체안 검토: E2E 실패로 인해 기존 Kaldi 기반 시스템으로 회귀 또는 병행 검토.
  • 기타 개발 현황: 프란의 리팩토링 진행, ID/음성 목록 추출 완료, Moira 통신 장애 발생.