DDPG/TD3 기반 주식 트레이딩 알고리즘 설계

Source

  • Basic Journals/Daily Journals/2022 임인년/임인년 199일, 7월 18일 월요일.md

Summary

DDPG 및 TD3 알고리즘을 활용한 주식 트레이딩 시스템의 문제 설정을 기록함. 상태 공간은 잔고와 6가지 기술적 지표(MACD, RSI 등)의 30개 종목 데이터를 포함하며, 액션 스페이스는 매수/매도/홀딩을 연속값으로 표현. 특히 매수 시 최대 수량(k) 결정 방식에 대한 의문과 기존 이산적 접근(25%~100%)과의 비교를 논의함.

Key Points

  • 알고리즘: DDPG, TD3
  • 상태(State): 잔고(balance) + 30 종목 * 6 지표(p, h, M, R, C, X)
  • 액션(Action): -k ~ k 범위의 연속값 (음수: 매도, 양수: 매수)
  • 의제: 매수 시 최대 수량(k)의 정의 모호성 및 기존 이산적 비율(25%, 50% 등) 방식과의 비교