NLP4STT: ITN 평가 메트릭 및 pysommers 의존성 고민

Source

  • Field Notes/ReturnZero/Daily Notes/Day 548. 2022-12-30.md

Summary

2022년 마지막 근무일 기록으로, NLP 기반 STT(음성인식)의 ITN(Inverse Text Normalization) 평가 메트릭(TER/TCER) 구현을 다룬다. 기존 라이브러리인 pysommers와의 의존성 문제를 해결하기 위해 레벤슈타인 거리 계산 코드의 통합 방안을 고민하며, 최종적으로 pysommers 내부에 compute_ter_with_word_range 함수를 추가하는 방향으로 결정했다. 다만, 입력 변수(ref, input, word_range, hyp)의 역할과 word_range의 필요성에 대한 의문점이 남아 있다.

Key Points

  • NLP4STT 프로젝트의 테스트셋 평가 메트릭으로 ITN TER/TCER 도입
  • pysommers 라이브러리와의 강한 결합으로 인한 의존성 관리 고민
  • 레벤슈타인 거리 구현 코드를 pysommers 내부에 통합하여 compute_ter_with_word_range 함수 추가 결정
  • 신경망 ITN의 대상 위치 표시 및 검증 로직에 대한 설계 논의 (ref, input, word_range, hyp 변수 정의)