Day 205: 오프라인 디코더 비교 실험 및 화자분리 장애 대응

Source

  • Field Notes/ReturnZero/Daily Notes/Day 205. 2022-01-21.md

Summary

본 노트는 오프라인 디코딩 방식(batch vs online simulation)의 성능 차이를 WER/CER로 비교하기 위한 실험 설계와, 다화자 환경에서 iVector 추출의 한계(Tdiar 파이프라인 필요성)를 논의한다. 또한 11시 배포 후 발생한 화자분리(SD) 오류를 Triton 버그로 추정하고, VAD/SD/ARS 서비스 분리 배포로 임시 해결한 과정을 기록한다. DB 재전사 로직의 한계와 핫픽스 적용 사항도 포함된다.

Key Points

  • 오프라인 디코더 선택을 위해 kaldi-online, batch(offline), batch(online simulating) 세 가지 방식을 WER/CER로 비교할 계획
  • 다화자 음성에서 iVector 추출 품질 저하 문제로, Tdiar 기반 발화 구간 분할 파이프라인 도입 필요성 확인
  • 11시 배포 후 화자분리 실패 이슈 발생: Triton에서 다중 모델 서빙 시 버그로 추정, 서비스 분리(VAD/SD/ARS)로 해결
  • DB 재전사 시 Primary Key 중복 문제 발생, 상태 변경(upsert) 방식 검토 및 카스토르의 핫픽스 적용