MWW EKS 배포 장애 및 STT 모델 평가 이슈 (Day 1168)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1168. 2024-09-10.md

Summary

MWW EKS 환경에서 Helm 업그레이드 실패(Role 소유권 메타데이터 누락)와 ‘conformer_2_ensemble’ 모델 미발견 오류를 겪으며, 수동 Role 설정 및 모델 제거 작업을 진행함. 또한 짧은 발화(2 초 이하) 데이터 필터링 및 일본어 주소 인식(NLP) 테스트 결과를 기록함.

Key Points

  • EKS Helm 업그레이드 실패: Role 의 managed-by 라벨 및 release-name/namespace 주석 누락으로 인한 ownership metadata 오류 발생.
  • 모델 평가 오류: eval 과정에서 ‘conformer_2_ensemble’ 모델을 찾을 수 없다는 NotFound 에러 발생.
  • 해결 방안: Role/RoleBinding 수동 정리 후 재설치, mww_models 에서 해당 모델 제거, deploy.yaml 경로 확인.
  • 데이터 전처리: 일반 모델 데이터에서 2 초 이하 짧은 발화 필터링 후 재학습 계획.
  • NLP 테스트: 일본어 주소 인식 시 시군구/도쿄도 등 행정구역 추출 및 교정 로직 확인.