TensorTrade RL 최적 하이퍼파라미터 설정 (2024-04-28)

Source

  • Basic Journals/Daily Journals/2024 갑진년/갑진년 119일, 4월 28일 일요일.md

Summary

2024년 4월 28일 기록된 TensorTrade 기반 강화학습(Reinforcement Learning) 트레이딩 환경의 최적 하이퍼파라미터 설정입니다. LSTM 기반 모델 사용, 학습률 스케줄링, 보상 클리핑 및 평가 설정 등 구체적인 환경 변수와 모델 파라미터가 포함되었습니다.

Key Points

  • TensorTrade 라이브러리를 활용한 강화학습 트레이딩 에이전트 실험 결과
  • LSTM 셀 크기 512를 사용하는 딥러닝 모델 아키텍처
  • 학습률(LR) 0.000778 및 단계적 감소 스케줄링 적용
  • 보상 함수 관련 설정: window_size 24, reward_window_size 12, max_allowed_loss 0.1
  • 평가(Evaluation) 시 탐색(exploration) 비활성화 및 별도 테스트 데이터셋 사용