Pronaia Engine Keyword Boosting 모델 전사 테스트 및 배포 준비

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1048. 2024-05-14.md

Summary

2024년 5월 14일 업무 기록으로, Pronaia 엔진의 프로토콜 변경 및 코드 리뷰 반영, 일본어 데이터셋 처리 검토, 그리고 팀벨(Timber) 키워드 부스팅(Keyword Boosting) 모델의 K8s 배포 및 전사 테스트 진행 상황을 담고 있다. 특히 Kaldi 테스트셋을 대상으로 한 두 차례의 전사 테스트 결과(CER, WER, SER 지표)를 기록하고 있으며, 외부 PySommers 연동 및 환경 변수 설정을 통한 테스트 실행 방법을 명시하고 있다.

Key Points

  • Pronaia 엔진의 proto 변경 및 리뷰 반영 작업 진행
  • 일본어 데이터셋 처리 및 ‘둠피’ 관련 데이터 확인 필요성 제기
  • 팀벨 키워드 부스팅 모델의 최신 Pronaia 엔진/API 연동 및 Sims K8s 배포 시도
  • Kaldi 테스트셋을 이용한 전사 테스트 수행 (CPU 워커 노드 기준)
  • 테스트 결과 기록: 첫 번째 테스트(CER 19.31%, WER 38.78%)와 두 번째 테스트(CER 19.02%, WER 41.04%)의 성능 지표 비교
  • 테스트 실행을 위한 환경 변수(PRONAIA_GRPC_URL 등) 및 Python 스크립트 실행 명령어 기록