Jetson Nano 클러스터 기반 TensorTrade 병렬 학습 환경 구축

Source

  • Depot/Infra/tensortrade 멀티프로세싱.md

Summary

단일 Jetson Nano 의 학습 성능 한계 (1080Ti 대비 저성능) 를 해결하기 위해 보유 중인 3 대의 Jetson Nano 를 활용하여 SAC 등 모델의 병렬 학습을 수행하고자 함. 이를 위해 Python/TensorFlow 버전 업그레이드, 시뮬레이션 모듈 (시풋 젯모듈) 적용, Docker 및 Kubernetes 기반의 컨테이너화 및 오케스트레이션을 통한 분산 학습 환경 구축을 목표로 함.

Key Points

  • 문제: 단일 Jetson Nano 의 학습 속도 저하 (1080Ti 대비 1/8~1/4 성능)
  • 자원: 유휴 상태인 Jetson Nano 3 대 (2GB 1 대, 4GB 2 대)
  • 목표: SAC 등 RL 모델의 병렬 학습 수행
  • 기술적 요구사항: Python/TensorFlow 버전 업그레이드, Docker 컨테이너화, Kubernetes 오케스트레이션, 시뮬레이션 모듈 통합