Vito STT 성능 벤치마킹 및 환경 설정 기록 (2024-07-01)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1096. 2024-07-01.md

Summary

입사 3주년 기념 일기 형식의 업무 노트로, Vito STT(음성인식) 시스템의 동적/정적 속도 측정 및 정확도(CER/WER) 벤치마킹 결과를 기록하고 있다. qoo10_test 및 TEDxJP_10K_num 데이터셋을 대상으로 한 여러 차례의 인퍼런스 테스트 로그(RTFx, Latency 등)가 포함되어 있으며, 개발 환경 경로(k8s, docker-images, license-server 등)와 관련 이슈(MWW, Internal error)를 간략히 메모했다.

Key Points

  • Vito STT 모델의 성능 평가: qoo10_test(760건)와 TEDxJP_10K_num 데이터셋을 사용한 벤치마킹 진행
  • 성능 지표 기록: RTFx(실시간 팩터), CER(문자 오류율), WER(단어 오류율), SER(문장 오류율) 및 Latency 측정 결과 다수 포함
  • 환경 설정 정보: wk02, apccstt02, ms02 등 서버별 k8s, docker-images, license-server 경로 및 개발계(adccstt) 정보 기록
  • 이슈 및 기타: MWW 이슈 대응 여부 확인, Internal error 발생 기록, 일본어 관련 업무 언급