팩맨 프로젝트: 환경별 배포 전략 및 설치 표준화

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1267. 2024-12-18.md

Summary

다양한 고객사(MWW, 신한, 서울소방 등)의 이질적인 하드웨어/클라우드 환경(AWS, Baremetal, VMWare 등)에 ‘팩맨’ 솔루션을 안정적으로 배포하기 위한 환경 분석 및 설치 표준화 작업. GPU 구성(단일/다중/MIG), 스토리지(NFS/EFS), 그리고 k8s/Docker 기반의 설치 옵션과 온라인 파이프라인 구성 요소를 정리하고, kubespray 및 helm을 활용한 오프라인 설치 시뮬레이션과 매뉴얼 작성을 진행 중.

Key Points

  • 고객사별 이질적인 인프라 환경(AWS EKS, Baremetal, VMWare, Openstack 등) 및 GPU 구성(단일, 다중, MIG)에 따른 호환성 문제 분석
  • k8s/Docker 기반 설치 옵션(STT only, SIMS Training 등) 및 온라인 파이프라인(VAD, ASR, ITN, PII 등) 구성 요소 정의
  • kubespray 및 helm을 활용한 오프라인 설치 시뮬레이션 진행 및 GPU operator, NFS 스토리지 설정 정리
  • 모델 디렉토리 네이밍 표준화 및 사이트 내 수정 프로토콜 정립을 통한 배포 안정성 확보
  • Deepgram API 연계를 통한 전사 후 자동 요약 기능(transcribe -> summarize) 테스트 및 검증