ASR 방향성 회의 및 3i4k 환경 구축 삽질

Source

  • Field Notes/ReturnZero/Daily Notes/Day 330. 2022-05-26.md

Summary

본 노트는 2022 년 5 월 26 일의 업무 기록으로, 주요 내용은 두 가지로 나뉜다. 첫째, 3i4k 프로젝트에서 fasttext 버전 불일치와 구형 TensorFlow(1.4) 호환성 문제로 인한 가상환경 구축 및 Keras 오류 해결 과정이다. 둘째, ASR 팀의 방향성 회의 내용으로, B2B 의 Contextual Biased LM 요구사항 증가에 대응하기 위해 NLP 와 ASR 팀의 협업을 강화하고, E2E 모델 성능 개선과 Kaldi 유지보수 병행, 다국어 (타이, 말레이 등) 데이터 처리 경험 축적, 그리고 RTFx/CER 지표 향상을 위한 엔지니어링 과제를 논의했다.

Key Points

  • 3i4k 프로젝트: fasttext 포맷 변경 및 TensorFlow 1.4 하위호환성 문제로 인한 가상환경 재구축 및 Keras opcode 문제 해결 시도
  • ASR 전략 회의: B2B 의 Contextual Biased LM 요구 증가에 따른 NLP-ASR 팀 협업 필요성 제기
  • 기술 로드맵: E2E 모델 성능 우수성 인정 및 Kaldi 유지보수 병행, 다국어 (타이, 말레이) 데이터 처리 파이프라인 경험 축적
  • 엔지니어링 목표: RTFx(속도) 및 CER(정확도) 지표 향상, 도메인 특화 코퍼스 개선, 페어워킹 도입 논의