GEC 모델 ONNX 변환 및 NLP4STT 진행 상황

Source

  • Field Notes/ReturnZero/Daily Notes/Day 558. 2023-01-09.md

Summary

2023 년 1 월 9 일 일지. GEC 모델의 ONNX 변환 과정에서 PyTorch forward 메서드의 인자 전달 방식 (kwargs) 과 ONNX export 의 호환성 문제로 인해 코드 수정이 필요했으며, 이를 해결하여 변환에 성공함. 또한 NLP4STT 프로젝트의 띄어쓰기 및 ITN(Inverse Text Normalization) 테스트셋 공유와 모델 비교 작업 진행.

Key Points

  • GEC 모델 ONNX 변환 시도 중 torch.onnx.export의 인자 전달 제한으로 인한 에러 발생 및 해결
  • PyTorch 모델의 forward 메서드 시그니처와 ONNX 입력 매핑 문제 (input_ids, attention_mask 등)
  • NLP4STT 관련 띄어쓰기 및 ITN 테스트셋 공유 및 테스트 코드 작성 계획
  • 학습 모델 간 케이스 비교 작업 진행