BMT Pronaia VAD 오류 해결 및 seq2seq 학습 기록

Source

  • Field Notes/ReturnZero/Daily Notes/Day 349. 2022-06-14.md

Summary

BMT Pronaia 시스템에서 ogg(vorbis) 포맷의 무작위 제로 패딩으로 인한 VAD 오작동 원인을 규명하고 핫픽스를 적용했다. 또한 3i4k VTS 데이터셋에 대한 의도 분류 실험 결과를 기록했으며, seq2seq, RNN, Teacher Forcing 등 자연어 처리 기초 개념을 학습한 내용을 포함한다.

Key Points

  • BMT Pronaia 오류 원인: ogg(vorbis) 포맷의 앞뒤 무작위 제로 패딩이 VAD(Voice Activity Detection) 오작동을 유발함.
  • 해결 방안: VAD 오작동 문제를 해결하기 위한 핫픽스 적용 완료.
  • VTS 실험 현황: 3i4k 데이터셋(약 200만 어터런스) 처리 중이며, 의도 분류 모델의 질문/비질문 분류 성능 지표(Accuracy, Precision, Recall 등)를 기록함.
  • 학습 내용: Transformer, Attention, seq2seq(인코더-디코더 구조), RNN/LSTM/GRU, 임베딩, Teacher Forcing 등 NLP 기초 개념 정리.