Day 490. 2022-11-02

Source

  • Field Notes/ReturnZero/Daily Notes/Day 490. 2022-11-02.md

Summary

2022-11-02 일지. Docker 컨테이너 실행 중 NVIDIA GPU 장치 경로 인식 오류(0000:61:00.0 vs 0000:a1:00.0) 발생하여 Docker 재시작으로 해결. 이후 Triton Server 시작 시 TensorRT 엔진 역직렬화 실패 오류 발생. 원인 분석 결과, 호스트 GPU(3090, compute 7.5)와 엔진 생성 환경(2080ti, compute 8.6)의 Compute Capability 불일치로 확인됨. 추가적으로 원격 서버(moira) 접근 불가 문제도 기록됨.

Key Points

  • Docker 컨테이너 내 NVIDIA GPU 장치 경로 인식 오류 발생 및 Docker 재시작으로 해결
  • Triton Server 시작 시 TensorRT 엔진 역직렬화 실패 (Engine deserialization failed)
  • 오류 원인: 호스트 GPU(3090, compute 7.5)와 엔진 생성 환경(2080ti, compute 8.6) 간 Compute Capability 불일치
  • 원격 서버(moira) 접근 불가 문제 발생