일본어 음성 인식(ASR) 전사 파이프라인 디버깅 및 경량화 시도

Source

  • Field Notes/ReturnZero/Daily Notes/Day 998. 2024-03-25.md

Summary

2024년 3월 25일 기록으로, 일본어 음성 전사 작업이 원활하지 않아 시스템 상태를 점검하고 있다. 기존 pysommers 데이터셋을 기반으로 테스트를 재개하며, Triton Server 기반의 경량화된 컨테이너 이미지를 사용하여 전사 성능과 가동 여부를 검증하는 실험을 진행 중이다.

Key Points

  • 일본어 음성 전사(ASR) 파이프라인의 불안정성 확인 및 워커 상태 점검 필요
  • pysommers 데이터셋을 활용한 테스트 재개 계획
  • Triton Server 기반 경량화 이미지(hub.rtzr.ai/rtzr/tritonserver:23.02-trt-python-py3-itn-240325-small) 적용 실험
  • gRPC를 통한 온라인 전사 서비스(online_bmt) 연결 테스트 수행