SIMS 개발계 배포 및 Istio/Envoy 로드밸런싱 문제 해결

Source

  • Field Notes/ReturnZero/Daily Notes/Day 978. 2024-03-05.md

Summary

개발 환경에 SIMS(음성 인식 서비스)를 배포하는 과정에서 Istio CRD 미설치로 인한 Helm 배포 실패를 겪었고, Istio 재설치 후 진행했다. 또한 GPU 리소스가 특정 노드(gpu01)로 편중되는 Envoy 로드밸런싱 문제를 조사 중이며, 현재 Docker 이미지 준비 및 기본 테스트 단계를 진행 중이다.

Key Points

  • SIMS 개발계 배포 목표: docker-compose 준비, NKS 설치, SIMS 이미지(hub.rtzr.ai/sims/backend) 적용
  • Helm 배포 오류: Istio CRD(DestinationRule, Gateway, VirtualService)가 없어서 실패 → Istio base 및 istiod 재설치로 해결
  • Envoy 로드밸런싱 이슈: GPU 사용량이 gpu01 노드로 편중됨. 클러스터 IP 통신 기록은 있으나 실제 분산 여부 확인 필요
  • 현재 진행사항: 3090용 이미지 준비, docker run 기반의 로컬 테스트 실행, 모델 디렉토리 구조(models, chart 등) 정리