데이터 랜덤픽 구현 및 라이브 피드 아키텍처 설계
Source
Ancom Workbench/Research/Stock Trader/데이터 랜덤픽 구현.md
Summary
이 노트는 강화학습 에이전트(특히 SAC)의 훈련을 위한 데이터 파이프라인 개선과 실시간 거래(Live Feed) 시스템 설계에 대한 기술적 고민을 담고 있다. 핵심 주제는 1) 훈련 시 데이터의 무작위 초기화(Random Reset)를 지원하기 위한 feed.py, node.py 등 데이터 스트림 계층의 reset() 메서드 수정, 2) SAC 알고리즘의 네트워크 구조(Critic/Target) 구현, 3) CCXT를 활용한 실시간 데이터 갱신 및 지갑(Wallet) 상태 동기화를 위한 ‘피더-스트림’ 커서 기반 아키텍처 설계이다. 저자는 기존 시뮬레이션 방식의 한계를 지적하며, Exchange 모듈을 DataFeed로 통합하여 실시간 데이터 흐름을 처리하는 방향으로 아키텍처를 재설계하는 과정을 기록하고 있다.
Key Points
데이터 스트림 계층(feed, node, transform, source)의 reset() 메서드를 수정하여 훈련 시 데이터의 무작위 시작점(Random Reset)을 지원함.
SAC(Soft Actor-Critic) 에이전트 구현을 위해 Actor/Critic 네트워크 및 Target Network 구조를 설계하고, GPU 설정 및 학습 파라미터를 조정함.
실시간 거래(Live Feed)를 위해 CCXT를 데이터 소스로 활용하며, Exchange 모듈을 DataFeed 계층에 통합하여 지갑(Wallet) 상태와 시장 데이터를 동기화하려는 아키텍처 변경 시도.
데이터 갱신 로직을 ‘피더(Feeder)-스트림(Stream)‘의 커서(Cursor) 비교를 통해 구현: 스트림의 요청 커서가 피더의 현재 커서보다 크면 CCXT에서 최신 데이터를 갱신하고 반환함.
바이낸스(USDT) 데이터로 학습한 모델을 다른 시장(예: 한국원화)에 적용하는 일반화 가능성에 대한 의문 제기.
스트림 구현 및 아키텍처 고민
TensorTrade 라이브 피드 구현의 기술적 장벽과 개발자 심리
TensorTrade 2.0 적용 및 RL 에이전트 디버깅
SAC 알고리즘의 GPU 최적화 및 성능 병목 분석
Whisper 실시간 스트리밍 솔루션 탐색
SAC (Soft Actor-Critic) 강화학습 소개
2022-02-17: 강화학습 및 지속적 학습 관련 자료 수집
Whisper 차트 개선 및 배포 자동화
Triton-Kaldi 오프라인 디코더 아키텍처 설계 및 구현 계획
Stock Trader 데이터 준비 및 아키텍처 검토
Rustdesk 연동 성공 및 Tailscale 활용
2024-04-18 일지: RL 학습 환경 구성 및 시스템 아키텍처 구상
Stock Trader 이벤트 리스너 및 시뮬레이션 설정
Tensortrade의 Gymnasium 및 Ray 호환성 개선
CloudWorker 아키텍처 및 통신 프로토콜 설계 검토
TentTrade 2.0 마이그레이션 장애요인 및 핵심 요구사항
TD3 기반 주식 트레이딩 알고리즘 설계
Ray RLlib PPO 트레이딩 환경 초기화 오류 (Gymnasium API 호환성)
GOP(Kaldi) 구현 준비 및 GRPC 프로토콜 설계
RL 기반 주식 트레이딩 봇 설계: 에피소드 길이 및 데이터 고려사항
TensorTrade RL 최적 하이퍼파라미터 설정 (2024-04-28)
FreqAI 설정 및 커스텀 데이터 활용 가능성 탐구
RL 트레이딩 전략 학습 및 검증 과정 (2024-05-02)
WSL)
비트코인 상승장 구간 정의 및 데이터 수집 계획
강화학습 기본 개념 정리 및 의문점
강화학습 기반 암호화폐 자동매매 프로젝트 제안
Trade-Agent 검증 및 스캘핑 전략 검토
RLHF(인간 피드백 기반 강화학습) 개요
KOF99 네스츠 데이터 기반 AI 학습 아이디어
강화학습 봇 재고
2024-05-07 일기: 플로이드-워셜 알고리즘 학습
임인년 189일, 7월 8일 금요일
AI 금융 및 알고리즘 트레이딩 참고 문헌
2024-04-17 일기: RL 학습 및 시스템 최적화 노트
오프로딩: 속도 할당 및 유틸리티 함수 설계
쿠폰함 설계 및 AWS 아키텍처 검토 (Day 111)
트레이더봇 부분체결 버그 및 LILAC 구현 고민
출력 파이프라인 정리 및 Protobuf 정의 시도
Kaldi BigLM Rescoring 구현 및 하이퍼파라미터 튜닝
WFST 엔진 구현 및 토큰 파싱 로직 설계
RLLib 얼라인: 학습 코드 검토 및 Google Trends 데이터 검증
옵셔널 구문 설계
쿠폰함 기능(VA-633) 설계 및 구현 계획
일본어 데이터 전사 이슈 및 두나무 로깅 아키텍처
Confidence 구현
gip-decoder 배포 및 TTS 아키텍처 검토
오프라인 디코딩 아키텍처 비교
GoP 계산 파이프라인 분석 및 구현 계획 (Day 275)
쿠폰함 구현 및 GoodProperties 설계 논의 (Day 134)
AncomBase 아이디어 백로그: 가격 예측, 드걸 부활, 서적관리
쿠폰함 기능 구현 및 DB 스키마 설계 (Day 163)
Triton-Kaldi 오프라인 디코더 구현 및 Triton 배치 처리 분석
ReturnZero Day 133: 쿠폰함 구현 및 보상(Reward) 구조 설계
gRPC 서버 구현 및 iVector 추출 파이프라인 분석 (2022-04-07)
현택의 블록체인 기반 데이터 거래 모델 고찰
Day 117 (2021-10-25) - S-72 데이터 처리 및 쿠폰함 구현
ReturnZero Day 594: 일본어 데이터 파이프라인 및 ITN 아키텍처 검토
폰 데이터 이전 및 정리 체크리스트
Qoo10 rtboost 구현 및 dadumi aligner 알고리즘 설계 고민
3i4k 데이터 정제 전략 및 SAC 프로젝트 아키텍처 정의
Kaldi 기반 GoP(Goodness of Pronunciation) 구현 분석 및 코드 탐색
Day 282. 2022-04-08: GRPC 컴파일 시도 및 GoPRequest 파이프라인 설계
Triton Ensemble 구현 및 NLP4STT 띄어쓰기 이슈
맞춤법 데이터 구조 및 토크나이징 전략 논의
Triton 서버 구축 및 pysommers 데이터 전처리
Triton-Kaldi Offline Decoder 설계 및 HifiGAN 연구
Parquet 오디오 데이터 추출 및 전처리 스크립트
GoP(Goodness of Pronunciation) 서비스 구현 및 NLP 태스크 검토
HifiGAN) 학습 현황
gop-kaldi 디코더 구조 분석 및 스트림 전송 설계
GoP 레시피 분석 및 CPU 온라인 디코더 아키텍처 검토
Triton-Kaldi 통합 테스트 및 팅커벨 사전 기능 설계 (Day 231)
쿠폰함 구현 및 DB 스키마 마이그레이션 (Day 167)
Greedy Confidence 및 Entropy 기반 신뢰도 추론 아키텍처
rt-tokenizer CLI 구현 및 백엔드 디토크나이징 파이프라인 적용
RTZR-STT 패키징 자동화 및 모델 레지스트리 설계
Day 250: Rescore 구현 완료 및 Triton-Kaldi 환경 구축 삽질
ITN 모델 최적화 및 데이터 전처리 작업 기록
통합 ITN(다듬이) 아키텍처 및 프로젝트 현황
긴 입력 처리 아키텍처 검토 (Day 586)
BLS 구현 및 배포 준비 (Day 694)
어제를 사는 힘 (2025-12-19)
stamcord 아키텍처 개선 및 하드웨어 프로젝트 메모
일단 합쳤다가 풀기 (Batch Processing & Async Architecture)
GoP-Kaldi 파이프라인 구현 막힘: 어터런스 단위와 디코더 가정의 불일치
MWW 한국어 STT 배포 및 SIMS Backend 아키텍처 검토
ReturnZero Day 764: 헬름차트 변경 및 배치 처리 아키텍처 논의
Triton-Kaldi 디코딩 아키텍처 분석 및 iVector 적응 개념 탐구
CD 파이프라인 구축 계획
SIMS 암호화 구현 및 다국어 모델 파이프라인 논의
멀티뷰 학습 및 vLLM 서빙 엔진 탐색
일본어 ITN 테스트 및 데이터 문제 확인
맞춤법 검사 자동화 봇 및 데이터 파싱 로직
Callabo STT 성능 개선 및 일본어 Qoo10 데이터 얼라인 전략
Day 553: 띄어쓰기 벤치마크 설계 및 Pronaia Engine 아키텍처 분석
ITN 개발 및 에이전트 아키텍처 논의 (Day 680)
팀벨 문의 - 웹소켓-gRPC 연동
Kiwi NLP 모델 빌딩 및 데이터 전처리 작업 기록
Triton-Kaldi 통합 및 Kaldi 레시피 구조 분석 (Day 190)
코드 리뷰 진행
mww 운영계 배포 아키텍처 및 구성 요소
ReturnZero Day 124: 쿠폰함 구현 및 기획 변경
Abomikluster: 이종 아키텍처 Kubernetes 클러스터 구성
모델 서빙 아키텍처 논의
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
SUJ-298 메일 포워딩 설계 및 AWS SES 비교
일본어 음성 전사 파이프라인 설계 및 고려사항
일본어 데이터 전처리 및 ITN 방침 (Day 623)
일본어 데이터 정제 및 전처리 파이프라인 (Day 1562)
ReturnZero Day 79: 인프라 설정 복구 시도 및 일감 데이터 쿼리
프로나이아(Pronaia) 일본 배포 및 API 접근 제어 아키텍처 논의
2025-08-22 업무: 현대캐피탈 고도화, 암호화 구현, Next Model 디버깅
쿠폰함 서버 버그 수정 및 Rails 데이터 처리 고민
일본어 ASR 모델 학습 및 데이터 전처리 진행 상황 (2024-07-15)
MMT 및 스트리밍 아키텍처 연구 방향성 (진홍 선배 논의)
Envoy 로드밸런싱 아키텍처 재고 및 GPU 운영 환경 정리
Rule-based NER 및 Semantic Role Labeling 구현 전략
S2 리빌드 문서화 및 RTZR STT 솔루션 아키텍처 정리
쿠폰함 모델 리팩터링 및 DB 설계 결정 (Day 169)
Day 125: 쿠폰함 구현 및 DB 연결 문제 해결
미래에셋 방문 및 일본어 데이터 준비 작업
프로나이아 엔진 아키텍처 및 운영 이슈 (Day 715)
현대캐피탈 고도화 및 utterance_save 암호화 구현 현황 (2025-08-04)
utterance_save 암호화 구현 및 SIMS 파이프라인 수정
2026-01-19 업무: 제로원 TTS 데이터 파이프라인 및 일본어 ASR 모델 개선
다듬이 올인: 문장 처리 파이프라인 및 말풍선 병합 로직 설계
ReturnZero Day 1650: 업무 현황 및 제로원 TTS TN 설계 초안
rt-gec 토크나이저 이슈 및 일본어 ITN 학습 데이터 가이드라인
Kiwi 형태소 분석기 모델 학습 및 데이터 변환 프로세스
2026-01-21 업무: 제로원 TTS 데이터 정제 실패 및 일본어 STT 모델 개선 계획
프로나이아 모델 배포 및 스마트 어터런스 처리 로직 설계
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
Triton Python Backend 예제 실행 및 구조 분석
Day 253: Vito-kaldi 리팩토링 및 Triton-kaldi 반영
일본어 데이터 전사 비교 및 정규화 로직 수정
OpenStack Neutron VXLAN 및 Calico VXLAN MTU 설정 문제
S-72 데이터 복구 및 쿠폰 시스템 마이그레이션 (Day 118)
개인 위키 시스템 구축 요구사항 및 기술 스택 고려사항
WFST 엔진 구현 및 Commitment 작업 (Day 392)
데이터 전략 논의 (Day 845)
ReturnZero E2E 파이프라인 실행 순서 및 데이터 구조 분석
2026-01-29 업무: 일본어 ASR 모델 개선 및 제로원 데이터 이슈
Kiwi 형태소 분석기 학습 데이터 확보 및 일본어 ITN 개발 현황
2026-01-30 업무: 일본어 ASR 개선, 제로원 데이터 처리, 두나무 인프라 이슈
2022-05-18 일일 작업 기록: 서베이 및 배포 프로세스 개선 논의
Triton-Kaldi ASR 파이프라인 개선 및 스트레스 테스트 계획
Triton Server 기반 Kaldi ASR 배포 시도 및 환경 문제
ReturnZero Day 1500: 현대캐피탈 고도화 및 utterance_save 암호화 구현
ChatGPT-4o, 음성인식 및 관련 기술 탐색
2024-05-14 일기: AI 생존 고민 및 디퓨전 모델 학습 특성
2024-05-09 일기: Duolingo, 미쿠복싱, 강화학습 디버깅
일본어 데이터 전처리 및 정제 규칙 (Day 790)
팩맨TF 및 dadumi-worker 아키텍처 리팩토링 고려사항
Pronaia Engine 필터링 및 아키텍처 도식화 (Day 1044)
안드로이드 인증 구현 및 Keycloak 연동 고민
2023-08-22 작업 일지: 일본어 데이터 전처리 및 Pronaia 테스트 환경 구축
2025-08-20 업무: 현대캐피탈 고도화, 암호화 구현, Next Model 환경 구축
ReturnZero Day 1489: utterance 암호화 구현 및 Next Model(일본어) 탐색
2021-10-05 일일 작업 기록: Logstash 오류 해결 및 쿠폰함 기능 설계
Day 90: Git 실수, 데드락 논의, Logstash Cron 구현
ReturnZero Day 427: SAC 로직 기획 및 Highlighter 구현 방향
Day 99: 쿠폰함 기능 확장 및 DB 설계 논의
ReturnZero: 컴포짓 클래스 및 라벨링 규칙 설계 고민
GOP 프로젝트: ivector 문제 탐색 및 도커 배포 준비 (Day 299)
Kaldi GoP 파이프라인 분석 및 Decodable 인터페이스 혼선
Triton-Kaldi 보고 및 CER 준비 (Day 236)
Kaldi VAD 트리밍 입력의 컨텍스트 처리 및 소머즈 후처리
Triton-Kaldi 백엔드 구조 학습 및 커스텀 백엔드 빌드 방법
현대캐피탈 차량번호 인식 모델 고도화 및 데이터 필터링
쿠폰함 어드민 구현 및 JSON 처리 난제 해결
쿠폰함 구현 및 Factory 메소드 패턴 적용 (Day 135)
폐쇄망(Air-gapped) Kubernetes 환경 구축 및 도구 평가
GPU 오퍼레이터 설치 및 Air-gapped 환경 구축 준비
Node Exporter 설치 및 학습 환경 메모리 문제
CLI 도구 숙달을 통한 업무 효율성 향상
Raspberry Pi 클러스터 구축 및 스토리지 고민
Day 610: 태스크 정리 (NLP4STT, 다듬이, 일본어 데이터)
현대캐피탈 고도화 및 utterance_save 암호화 구현 현황 (2025-08-05)