MWW 배포 및 ASR 파이프라인 디버깅 (2024-03-12)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 985. 2024-03-12.md

Summary

이 노트는 MWW 모델의 active threshold 조정과 public-hub를 통한 배포 성공을 기록하고 있다. 또한 일본어 YouTube 채널 데이터 다운로드 및 전사(transcription) 파이프라인 실행, 워드 부스팅 관련 설정, 그리고 timbel/mww 사용자의 Docker registry 인증 설정을 포함한다. 마지막으로 BMT 모델 추론 중 발생한 ‘unexpected inference output’ 오류 로그를 기록하여 디버깅 맥락을 남겼다.

Key Points

  • MWW 모델의 active threshold 조정 및 public-hub 기반 배포 완료
  • 일본어(ja) YouTube 채널 데이터 다운로드 및 전사 스크립트 실행 환경 설정
  • 워드 부스팅(Word Boosting) 관련 디렉토리 및 Notion 참고 링크 기록
  • Kubernetes 환경에서 timbel 및 mww 사용자의 Docker registry secret 생성
  • BMT 모델 추론 시 conformer_10_ensemble 모델에서 발생한 InvalidArgument 오류 로그 확인