Day 335. 2022-05-31

Source

  • Field Notes/ReturnZero/Daily Notes/Day 335. 2022-05-31.md

Summary

재택근무 11개월 차의 업무 일지로, BenchmarkASR 개발과 3i4k 데이터셋 기반 모델 실험을 병행했다. VITO Kaldi 및 Pronaia API 연동 시 JSON/CTM 포맷 해석과 테스트 환경(pytest) 설정에서 난항을 겪었으나, 3i4k 의도 분류 모델(HuggingFace) 로딩 및 실행에는 성공했다.

Key Points

  • BenchmarkASR: VITO Kaldi와 Pronaia의 프로토콜 차이로 인한 연동 어려움, pytest 로그 출력 실패 등 테스트 환경 문제 발생
  • 데이터 포맷 분석: VITO Kaldi의 token 정보 파싱 방식과 Pronaia의 utterance/word 구조 확인
  • 3i4k 모델: HuggingFace에서 제공된 klue-roberta-small 모델 로딩 및 실행 성공, 관련 문서(Notion) 참조