Day 329. 2022-05-25

Source

  • Field Notes/ReturnZero/Daily Notes/Day 329. 2022-05-25.md

Summary

CER 계산 및 rt-norm/rt-tokenizer 적용, NER 서베이 지속, 질문 개수 세기(물음표 기반) 아이디어 검토, BERT 임베딩 학습, 3i4k 모델 로딩 오류 디버깅, triton-kaldi 코드 리뷰 및 빌드 확인, GPU 할당 이슈 논의

Key Points

  • CER 계산 작업 완료 (rt-norm, rt-tokenizer 사용)
  • NER 서베이 진행 중, TTS는 후순위로 밀림
  • 질문 개수 세기 방법론 고민: 물음표 기반 ASR 처리 가능성 검토
  • BERT 및 단어 임베딩 관련 학습 및 참고 자료 수집
  • 3i4k 프로젝트에서 fasttext 모델 로딩 시 파일 포맷 오류 발생
  • triton-kaldi PR 코드 리뷰 및 빌드 성공 확인, GPU 할당 문제 논의