2024-09-19 업무: 일본어 STT 모델 튜닝 및 Prefix Decoder 디버깅

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1177. 2024-09-19.md

Summary

일본어 주소 인식 및 일반 모델의 워드 부스팅 준비, 프리픽스 디코더 구현, 온프레미스 환경 구성(PV Provisioner)을 진행함. 다이킨(Daikin) 수리 영수증 음성 데이터로 테스트 봇 평가 중이며, 정답지 부재로 모델 변경 전후 비교 평가 필요. RTX 3090 환경에서 자유발화 모델 구성 시 주소 인식 오류 발생 원인을 WFST 문제로 추정하고 그리디 디코딩 테스트 진행 중. Prefix Decoder 실행 시 TypeError 발생하여 인자 타입 불일치(ContextGraph vs ContextConfig 등)로 인한 에러를 확인하고 디버깅 중.

Key Points

  • 일본어 주소 모델 및 일반 모델 워드 부스팅 준비 진행
  • 프리픽스 디코더 구현 및 온프레미스 PV Provisioner 구성
  • 다이킨 음성 데이터 테스트: 정답지 부재로 인한 전후 비교 평가 필요
  • RTX 3090 환경에서 주소 인식 오류 발생, WFST 문제 가능성 확인
  • Prefix Decoder 실행 시 인자 타입 불일치(TypeError) 에러 발생 및 디버깅