TensorTrade SAC 에이전트 디버깅 및 거래 로직 개선

Source

  • Google Keep/문제.md

Summary

TensorTrade SAC 에이전트 학습 중 발생한 행렬 크기 불일치 오류(InvalidArgumentError)의 원인을 분석하고, 연속 거래로 인한 잔고 부족 문제를 해결하기 위한 쿨타임 로직을 제안함.

Key Points

  • SAC 에이전트 학습 시 actor_network 입력 차원 불일치([1,200] vs [240,256])로 인한 InvalidArgumentError 발생
  • 오류 원인으로 state 피드백 데이터의 차원 이상 또는 reset() 함수 문제 의심
  • 연속 거래 요청으로 인한 잔고 부족 문제 해결을 위해 Symbol 기반 Flag 딕셔너리를 활용한 쿨타임 로직 도입 제안
  • Flag 로직 구현: 거래 요청 시 Flag 설정 → 중복 요청 시 대기 → 갱신 완료 후 Flag 초기화