Total ensemble model

Source

  • Field Notes/ReturnZero/Daily Notes/Day 581. 2023-02-01.md

Summary

2023년 2월 1일 일기 형식의 노트로, ‘Total ensemble model’의 아키텍처(Tokenizer → Spacer → Interprocessor → Neural ITN → Postprocessor)를 단계별로 정리하고, 화자인식 프로젝트 보고회에서 기술 평가 결과(4개월간 진행, 풀리지 않음, total error 수치 등)를 기록함.

Key Points

  • Total ensemble model 파이프라인 구성: 입력 문자열 토큰화 후 Spacer 인퍼런스, Interprocessor(Decoder+ITN Tokenizer)를 거쳐 Neural ITN 인퍼런스 및 Postprocessing을 통해 최종 DECODED 출력
  • 화자인식 프로젝트 보고회 내용: 2022.09~2023.01 기간 기술 평가 진행
  • 화자인식 평가 결과: 기술적 해결 미흡, Cluster(50.33), Dialog(51.73) 등 total error 수치 기록
  • 로컬 Jupyter Notebook 실행 명령어 기록