Triton Ensemble 구현 및 NLP4STT 띄어쓰기 이슈

Source

  • Field Notes/ReturnZero/Daily Notes/Day 561. 2023-01-12.md

Summary

Triton Inference Server에서 Ensemble 모델을 구성하며 shared memory 부족 및 설정 파일 구문 오류(쉼표 누락)로 인한 에러를 해결하고 단일 요청 성공을 확인함. 다음 단계로 배치 처리(batching) 연동 필요성을 인지함. 또한 NLP4STT 파이프라인에서 띄어쓰기 모델의 오류가 ITN(Inverse Text Normalization) 처리, 특히 조사 ‘이’의 인식에 부정적 영향을 미치는 문제를 발견함.

Key Points

  • Triton Ensemble 설정 시 shared memory 크기 부족으로 인한 초기화 실패 및 설정 파일 JSON/YAML 구문 오류(쉼표) 해결
  • 단일 요청 성공 확인 후, 단계별 모델 간 배치 데이터 전달(batching) 연동 필요성 도출
  • NLP4STT 파이프라인에서 띄어쓰기 모델의 성능 저하가 ITN 처리(특히 조사 ‘이’)에 오류를 유발하는 상관관계 확인