Day 1132: Airgap 환경 구축 및 GPU Operator 배포 시도

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1132. 2024-08-06.md

Summary

2024-08-06 업무 기록으로, Airgap(단절) 환경에서의 Kubernetes 클러스터 구축 및 NVIDIA GPU Operator 배포 과정을 다룹니다. Podman과 Ansible을 활용한 오프라인 리포지토리 설정은 성공했으나, GPU 드라이버 이미지 풀링 시 ‘ImagePullBackOff’ 오류가 발생하여 해결 중입니다. 또한 PII 필터 수정, 한국어 mel2vec 모델 테스트 등 기타 개발 업무도 병행했습니다.

Key Points

  • Airgap 환경 구축: Podman 기반 이미지 다운로드 및 Ansible을 통한 오프라인 YUM 리포지토리 설정 시도
  • 네트워크/호스트 설정: 서브넷 문제 확인 및 localhost 기준 테스트 성공, kubeconfig 생성 필요성 확인
  • GPU Operator 배포 실패: 오프라인 레지스트리(10.0.1.40:35000)에서 NVIDIA 드라이버 이미지(535.183.06)를 찾지 못해 ImagePullBackOff 오류 발생
  • 기타 개발 업무: Engine PII 필터 수정, 한국어 mel2vec 모델 테스트, 코드 가독성 개선