TensorTrade 2.0 적용 및 RL 에이전트 디버깅

Source

  • Depot/Infra/Tensor trade 2.0 적용방안.md

Summary

TensorTrade 2.0 기반의 RL 트레이딩 시스템 구축을 위해 CCXT를 활용한 에이전트(SAC), 실행 서비스, 데이터 피드 패키지의 상속 구현을 계획함. 현재 에이전트 학습이 기대대로 작동하지 않아 액션/리워드 스키마(managedRisk, riskAdjusted 등)와 성능 평가 기준(비교군 설정)에 대한 문제의식을 제기함.

Key Points

  • TensorTrade 2.0 아키텍처 적용: tensortrade/agents, oms/services/execution/ccxt, feed 패키지를 상속하여 구현 예정
  • 외부 서비스 연동: CCXT를 통해 Exchange 서비스 및 Market Feed 연동
  • 학습 문제 진단: SAC 에이전트의 학습 부진 원인 분석 중 (액션/리워드 스키마 검증 필요)
  • 성능 평가 체계 수립: 초기금액 유지, Buy & Hold 등 비교군 설정 및 Reward Scheme 재검토 필요