Day 957: 주소모델 실험 및 Kubernetes GPU 환경 설정

Source

  • Field Notes/ReturnZero/Daily Notes/Day 957. 2024-02-13.md

Summary

이 노트는 주소 모델의 두 가지 실험 설계(자유발화 제외 vs 전체 데이터 사용)와 Kubernetes 환경에서의 GPU 스케줄링 및 컨테이너 실행 오류 해결 과정을 기록한 일일 할 일 목록이다.

Key Points

  • 주소 모델 실험: 자유발화 데이터를 제외한 205 개 데이터셋과 전체 주소 데이터를 대상으로 모델 실행 계획
  • Kubernetes GPU 환경: binpack 알고리즘 고려 및 NVIDIA 드라이버/라이브러리 버전 불일치 오류 발생
  • GPU 할당 해결책: 파드 수준에서 GPU 리소스 할당 대신 컨테이너 수준에서 NVIDIA_VISIBLE_DEVICES 환경변수를 사용하여 특정 GPU 노출