Day 250: Rescore 구현 완료 및 Triton-Kaldi 환경 구축 삽질

Source

  • Field Notes/ReturnZero/Daily Notes/Day 250. 2022-03-07.md

Summary

Rescore 기능 구현을 David의 피드백을 통해 마무리하고, NFS 성능 문제로 인한 로컬 데이터 이동 및 도커 빌드 실패로 인한 구버전 바이너리 우회 방법을 적용했다. 또한 Triton-Kaldi 실험 라인 설정 중 tokenizer/LM 누락 및 로케일(LANG/LC_ALL) 설정 오류를 해결하며 클라이언트 코드 검토 및 단어집 규칙 정립을 시작했다.

Key Points

  • Rescore 구현 완료 (David 피드백 반영)
  • NFS 읽기 속도 저하(11GB 데이터)로 인한 로컬 저장소 이전
  • 도커 빌드 실패(22.04 환경)로 인한 21.08 구버전 도커 바이너리 추출 및 하드코딩된 경로 우회
  • Triton-Kaldi 실험 라인 설정 성공 (tokenizer 내 LM 누락, morfessor, perl 로케일 경고 해결)
  • 클라이언트 코드 검토 및 단어집 표제어/영문표기 규칙 정립 시작