Trade-Agent 검증 및 스캘핑 전략 검토
Source
Ancom Workbench/Research/Stock Trader/trade-agent 검증.md
Summary
강화학습 기반 트레이딩 에이전트(trade-agent)의 ‘존버’ 현상 원인을 분석하고, 스캘핑 전략으로의 전환 가능성을 모색하는 과정입니다. 현재 1 시간 단위 데이터에서는 단기 매매가 아닌 장기 보유 행태가 관찰되었으며, 이는 managed-risk 전략의 파라미터(손익 비율, 기간 등)와 관련이 있을 것으로 추정됩니다. 또한 분 단위 학습의 타당성, 시뮬레이션 환경에서의 매매 로직(조건부 매매 제거, 오더 스펙 처리), 그리고 거래 화폐(Base/Quote) 기준과 수수료 계산 방식 등 구현상의 명확화가 필요한 사항들을 정리하고 있습니다.
Key Points
현재 에이전트는 스캘핑 대신 장기 보유(존버) 행태를 보이며, 이는 학습 결과일 가능성이 높음
managed-risk 전략의 파라미터(손익 비율, 기간, 포트폴리오)와 액션 스페이스 구조가 행태에 미치는 영향 분석 필요
1 시간 단위 데이터는 스캘핑에 부적절하므로 분 단위 학습 전환 고려 중
시뮬레이션 환경에서 조건부 매매 로직 수정 및 오더 스펙(Order Spec) 처리 방식 재검토 필요
거래 화폐 기준(Base/Quote), 총거래액 계산 방식(수수료 포함 여부), 매수/매수 시 Quantity 기준 명확화 필요
RL 트레이딩 전략 학습 및 검증 과정 (2024-05-02)
Stock Trader 데이터 준비 및 아키텍처 검토
TensorTrade 2.0 적용 및 RL 에이전트 디버깅
강화학습 기반 암호화폐 자동매매 프로젝트 제안
Stock Trader 이벤트 리스너 및 시뮬레이션 설정
RL 기반 주식 트레이딩 봇 설계: 에피소드 길이 및 데이터 고려사항
데이터 랜덤픽 구현 및 라이브 피드 아키텍처 설계
2022-02-17: 강화학습 및 지속적 학습 관련 자료 수집
RLLib 얼라인: 학습 코드 검토 및 Google Trends 데이터 검증
일본어 이름 모델 검증 및 T4 배포 준비
TD3 기반 주식 트레이딩 알고리즘 설계
SAC (Soft Actor-Critic) 강화학습 소개
TensorTrade RL 최적 하이퍼파라미터 설정 (2024-04-28)
비트코인 상승장 구간 정의 및 데이터 수집 계획
SAC 통화 요약: 추출형 vs 생성형 요약 전략 및 평가 지표
강화학습 기본 개념 정리 및 의문점
FreqAI 설정 및 커스텀 데이터 활용 가능성 탐구
RLHF(인간 피드백 기반 강화학습) 개요
AI 금융 및 알고리즘 트레이딩 참고 문헌
Ray RLlib PPO 트레이딩 환경 초기화 오류 (Gymnasium API 호환성)
강화학습 봇 재고
TentTrade 2.0 마이그레이션 장애요인 및 핵심 요구사항
3i4k 모델 검증 및 VTS 테스트셋 평가 전략
스트림 구현 및 아키텍처 고민
KOF99 네스츠 데이터 기반 AI 학습 아이디어
2024-04-18 일지: RL 학습 환경 구성 및 시스템 아키텍처 구상
Tensortrade의 Gymnasium 및 Ray 호환성 개선
Rustdesk 연동 성공 및 Tailscale 활용
ICT 트러스트 추상화 및 모바일 캐싱 전략 검토
TensorTrade 라이브 피드 구현의 기술적 장벽과 개발자 심리
2024-05-07 일기: 플로이드-워셜 알고리즘 학습
임인년 189일, 7월 8일 금요일
WSL)
2024-04-17 일기: RL 학습 및 시스템 최적화 노트
개인정보 수집 오남용 및 연구 방법론 검토 (2023-10-20)
BSWACA 오프로딩 전략 및 리소스 할당 고민
2022-12-26 회사 근황 및 NLP 기술 검토
3i4k 데이터셋을 활용한 화행분류 Feasibility 검토
주소 인식 모델 성능 검증 및 Triton 배포 전략
Day 847: Triton 테스트 환경 구축 및 특허 전략 논의
3i4k 데이터 정제 전략 및 SAC 프로젝트 아키텍처 정의
WFST 최적화 및 결정화 알고리즘 검토
프로나이아 패키지화 및 3i4k FP 검증
ASR-ITN 파이프라인 최적화 및 재학습 전략 논의
2024-09-26: AI 연구 전략, Llama 3.2 및 로컬 LLM 도구
Engine 코드 수정 및 검증 (2024-12-27)
AncomBase 아이디어 백로그: 가격 예측, 드걸 부활, 서적관리
gip-decoder 배포 및 TTS 아키텍처 검토
서버 스케줄링 및 클라이언트 오프로딩 전략 비교
CloudWorker 아키텍처 및 통신 프로토콜 설계 검토
맞춤법 데이터 구조 및 토크나이징 전략 논의
GOP 디버깅: CMVN 적용 효과 검증 및 오해 해소
Rule-based NER 및 Semantic Role Labeling 구현 전략
GOP 디코더 PoC 배포 및 검증 우선순위 재정의
MWW 배포 회고 및 테스트 데이터셋 구성 전략
현택의 블록체인 기반 데이터 거래 모델 고찰
2024-05-14 일기: AI 생존 고민 및 디퓨전 모델 학습 특성
일본어 주소 인식 모델 배포 및 MWW STT 성능 검증
Python Client 초기 배포 및 구조 검토 (Day 358)
ITN 서비스 배포 및 VAD 통합 구성 검토
Pronaia-Engine 코드 폴리싱 및 Triton Mel 성능 검증
2024-05-09 일기: Duolingo, 미쿠복싱, 강화학습 디버깅
Triton Inference Server 앙상블 배치 처리 검증
오프로딩: 속도 할당 및 유틸리티 함수 설계
AI 프리랜서 관련 참고 링크
긴 입력 처리 아키텍처 검토 (Day 586)
2023-10-20T05_34_14.038+09_00
워커 3단 배포 전략 및 차트 개발 현황
FastAPI 학습
폰 데이터 이전 및 정리 체크리스트
TTS 후순위 전환 및 ASR 집중 전략 수립 (2022-05-23)
루리웹 및 Rebrn 링크 모음 (2023-10-20)
ReturnZero Day 532: Kiwi 모델 검증 및 일본어 숫자 태깅 규칙 분석
농협카드 Docker 전환 검토 및 현대캐피탈 음성인식 고도화
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
mel2vec 영숫자 인식 성능 검증 및 패딩 실험 결과
ReturnZero Day 594: 일본어 데이터 파이프라인 및 ITN 아키텍처 검토
논문 발표자료 구성 및 실험 설계 전략
GoP 레시피 분석 및 CPU 온라인 디코더 아키텍처 검토
포그 컴퓨팅 리소스 할당 및 오프로딩 전략 연구 노트
Pronaia-engine 법무 검토 요청 및 Pacman 오픈소스 정리
Callabo STT 성능 개선 및 일본어 Qoo10 데이터 얼라인 전략
일본어 ASR 프로젝트 현황 및 전략 논의 (Day 627)
ReturnZero Day 1047: 일본어 ASR 모델 검증 및 성능 분석
Excalidraw Drawing (2026-01-01)
ReturnZero Day 359: Python Client 완료 및 3i4k 데이터 FP 검증 시작
SIMS 0.4.0 배포 시험 및 설정 검토
쿠폰함 설계 및 AWS 아키텍처 검토 (Day 111)
Parquet 오디오 데이터 추출 및 전처리 스크립트
트레이더봇 부분체결 버그 및 LILAC 구현 고민
MWW 한국어 STT 배포 및 SIMS Backend 아키텍처 검토
온프레미스 Triton 엔진 동시처리 검증 및 Envoy LB 구성
ReturnZero Day 488: 팀 기조 변경 및 NLP 전략 재정의
License Proxy 기술 검토
TCER) 구현 분석
dadumi lang 포함
청자 기술 학습
Related Notes
Kay의 소회: 리턴제로의 현재와 생존 전략
콘텐츠 소비 및 클라우드릿(Clalrit) 통합 전략
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
일본어 ASR 모델 성능 검증 및 디버깅 (Day 708)
Triton Ensemble 구현 및 NLP4STT 띄어쓰기 이슈
2024-03-14 일기: 듀오링고 학습 및 yt-dlp 프록시 구축
ASR), 인프라 혼돈
오픈소스 라이브러리 운영 및 글로벌화 전략
2025-10-13 업무: 일본어 STT 모델 검증 및 제로원 제안서 초안
데이터 전략 논의 (Day 845)
ReturnZero Day 482: 비즈니스 통화 스크립트 검토 및 결과 비교 실험
두나무 STT 프로젝트 진행 현황 및 개인정보 처리 법률 검토
ReturnZero Day 1745: PVI, 일본어 ASR 개선 및 Kubernetes 보안 검토
약속) 성능 분석 및 정제 전략
2026-01-17 일지: 올웨더 리밸런싱 및 개발 프로세스 검토
Gemma2 기술 검토
일본어 NLP 파이프라인 및 데이터셋 전처리 작업 기록
Triton Export 및 버전 호환성 문제
가치 있는 발화 추출의 어려움과 SAC 방향성 고민
Triton-Kaldi ASR 파이프라인 개선 및 스트레스 테스트 계획
가독성 개선
멀티뷰 학습 및 vLLM 서빙 엔진 탐색
Day 491: E2E 음성 인식 서버 배포 장애 및 Kaldi 대체안 검토
어제를 사는 힘 (2025-12-19)
일본어 Cutoff 모델 배포 준비 및 Partial 응답 속도 검증
ReturnZero Day 173: 테스트 전략 및 쿠폰함 작업
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
2025-03-20 업무 기록: 개인정보 시스템 법적 검토 및 라이선스 서버 로직
일본어 주소 인식 시스템 개선 및 파인튜닝 전략
PRONAIA BMT 서비스 배포 및 테스트 데이터 준비 현황
T4 빌드 및 일본어 NLP 처리 방안
일본어 STT 이슈
GEC 모델 ONNX 변환 및 NLP4STT 진행 상황
Recall) 이해 및 HuggingFace Transformers 학습 코드 분석
일본어 데이터 정제 및 전처리 파이프라인 (Day 1562)
ChatGPT-4o, 음성인식 및 관련 기술 탐색
2024-04-19 일기: 과소비, 가족 지원, 강화학습(Ray RLlib) 학습
자바스크립트 및 머신러닝 관련 도서 목록
2019-02-26: 전민동 거주 반 년 및 출구 전략 고민