본 노트는 2024 년 4 월 18 일의 개인 일지로서, Duolingo 학습의 효능감 저하와 집안 정리 계획 등 일상적 기록과 함께, Ray RLlib 를 활용한 강화학습 (RL) 시스템 개발에 대한 기술적 고민을 담고 있다. 특히 새 SAC API 의 LSTM 미지원 문제로 PPO-LSTM 대안을 검토하고, 학습 (Training) 과 서빙 (Serving) 을 분리한 시스템 아키텍처 (클라이언트 - 모델서버 구조) 를 구상하는 과정을 기록하고 있다. 또한 llm2vec(ELLA) 관련 최신 동향을 간단히 언급하고 있다.
-
2024-04-17 일기: RL 학습 및 시스템 최적화 노트
-
어제를 사는 힘 (2025-12-19)
-
2024-04-19 일기: 과소비, 가족 지원, 강화학습(Ray RLlib) 학습
-
멀티뷰 학습 및 vLLM 서빙 엔진 탐색
-
2022-02-17: 강화학습 및 지속적 학습 관련 자료 수집
-
TensorTrade RL 최적 하이퍼파라미터 설정 (2024-04-28)
-
2024-03-14 일기: 듀오링고 학습 및 yt-dlp 프록시 구축
-
Day 904: STT 학습 기능 논의 및 배포 준비 (2023-12-21)
-
RL 트레이딩 전략 학습 및 검증 과정 (2024-05-02)
-
2017-07-03: 분산 시스템 스케줄링 구현 및 개인 일지
-
2024-12-03 작업 일지: 시스템 튜닝 및 배포
-
데이터 랜덤픽 구현 및 라이브 피드 아키텍처 설계
-
TensorTrade 2.0 적용 및 RL 에이전트 디버깅
-
Ray RLlib PPO 트레이딩 환경 초기화 오류 (Gymnasium API 호환성)
-
2024-05-07 일기: 플로이드-워셜 알고리즘 학습
-
RLLib 얼라인: 학습 코드 검토 및 Google Trends 데이터 검증
-
스트림 구현 및 아키텍처 고민
-
Tensortrade의 Gymnasium 및 Ray 호환성 개선
-
SAC (Soft Actor-Critic) 강화학습 소개
-
WSL)
-
TentTrade 2.0 마이그레이션 장애요인 및 핵심 요구사항
-
TensorTrade 라이브 피드 구현의 기술적 장벽과 개발자 심리
-
Stock Trader 이벤트 리스너 및 시뮬레이션 설정
-
TD3 기반 주식 트레이딩 알고리즘 설계
-
Day 555: ONNX 모델 배포 및 환경 구성 고민
-
RL 기반 주식 트레이딩 봇 설계: 에피소드 길이 및 데이터 고려사항
-
Rustdesk 연동 성공 및 Tailscale 활용
-
강화학습 기본 개념 정리 및 의문점
-
강화학습 기반 암호화폐 자동매매 프로젝트 제안
-
FreqAI 설정 및 커스텀 데이터 활용 가능성 탐구
-
비트코인 상승장 구간 정의 및 데이터 수집 계획
-
RLHF(인간 피드백 기반 강화학습) 개요
-
Trade-Agent 검증 및 스캘핑 전략 검토
-
임인년 189일, 7월 8일 금요일
-
강화학습 봇 재고
-
KOF99 네스츠 데이터 기반 AI 학습 아이디어
-
AI 금융 및 알고리즘 트레이딩 참고 문헌
-
mww 운영계 배포 아키텍처 및 구성 요소
-
Stock Trader 데이터 준비 및 아키텍처 검토
-
2023 년 1 월 3 일 일기: 개인적 반추 및 지식 증류 학습
-
청자 기술 학습
-
2024-05-14 일기: AI 생존 고민 및 디퓨전 모델 학습 특성
-
개인 위키 시스템 구축 요구사항 및 기술 스택 고려사항
-
2021-07-06 일기: 전기자전거 및 라즈베리파이 NAS 구상
-
Jetson Nano 클러스터 기반 TensorTrade 병렬 학습 환경 구축
-
Sandbox BMT 테스트 환경 구성 및 설정
-
Day 847: Triton 테스트 환경 구축 및 특허 전략 논의
-
인프라 환경 재정비 및 NAS 스토리지 구성
-
편의점 강도 대비 자동 조준 CCTV 구상
-
stamcord 아키텍처 개선 및 하드웨어 프로젝트 메모
-
AncomBase 아이디어 백로그: 가격 예측, 드걸 부활, 서적관리
-
Abomikluster: 이종 아키텍처 Kubernetes 클러스터 구성
-
2023-08-22 작업 일지: 일본어 데이터 전처리 및 Pronaia 테스트 환경 구축
-
gip-decoder 배포 및 TTS 아키텍처 검토
-
통합 ITN(다듬이) 아키텍처 및 프로젝트 현황
-
2024-05-09 일기: Duolingo, 미쿠복싱, 강화학습 디버깅
-
AI 프리랜서 관련 참고 링크
-
Node Exporter 설치 및 학습 환경 메모리 문제
-
AWS CLI 환경 설정 및 Triton Server 배포 준비
-
E2E ASR 모델 Triton 서빙 환경 구축 및 테스트 (Day 723)
-
폐쇄망(Air-gapped) Kubernetes 환경 구축 및 도구 평가
-
현택의 블록체인 기반 데이터 거래 모델 고찰
-
2024-05-17 일기: Llama 3 양자화 가이드 및 일본어 데이터셋 수집
-
루리웹 및 Rebrn 링크 모음 (2023-10-20)
-
하코네 여행 경비 및 일본어 학습
-
2023-08-08 작업 일지: 일본어 학습, MWW 배포, Dadumi
-
2023-10-20T05_34_14.038+09_00
-
배포 워크플로우 논의 (Day 859)
-
Triton Custom Backend 학습 계획 및 모델 웜업 개념 정리
-
Envoy 로드밸런싱 아키텍처 재고 및 GPU 운영 환경 정리
-
2022-11-21 작업 기록: 한글 교정 로직 수정 및 Highlighter PoC 환경 설정
-
2023-01-05 일지: pysommers 배포 문제 해결, NLP4STT 띄어쓰기 모델 최적화 및 사업계획
-
RL 모델 서빙 고민
-
GPU 오퍼레이터 설치 및 Air-gapped 환경 구축 준비
-
Stable Diffusion 파인튜닝 및 LLM 환경 구축 기록
-
Related Notes
-
2026-01-12 일지: Docker 빌드 및 NFS 언마운트 팁
-
Greedy Confidence 및 Entropy 기반 신뢰도 추론 아키텍처
-
MWW 배포 회고 및 테스트 데이터셋 구성 전략
-
배포 테스트 (2024-09-11)
-
로컬 AI 환경 구축과 그 의미에 대한 성찰
-
한중일 한자 발음 매핑 및 데이터베이스 구축 구상
-
CloudWorker 아키텍처 및 통신 프로토콜 설계 검토
-
ReturnZero Day 1139: 개발 환경 구축 및 시스템 장애 대응
-
SIMS 헬름 구성 및 파이프라인 자동화 고민
-
S2 리빌드 문서화 및 RTZR STT 솔루션 아키텍처 정리
-
3i4k 데이터 정제 전략 및 SAC 프로젝트 아키텍처 정의
-
Day 957: 주소모델 실험 및 Kubernetes GPU 환경 설정
-
팀벨(Timbel) 개발 환경 구축 및 라이선스 발급 기록
-
폰 데이터 이전 및 정리 체크리스트
-
CentOS 7 기반 NVIDIA GPU 환경 구축 및 모델 배포 준비
-
Triton Server 기반 Kaldi ASR 배포 시도 및 환경 문제
-
2026-03-19 일지: k3s 및 Stamcord 작업
-
2020-06-17 일기: 생활 관리 및 학습 기록
-
Jetson Nano에서 Stable Diffusion 실행 환경 구성 시도
-
일본어 ASR 모델 학습 및 데이터 전처리 진행 상황 (2024-07-15)
-
일본어 Neural ITN 및 4090 환경 빌드 시도
-
프로나이아 엔진 아키텍처 및 운영 이슈 (Day 715)
-
쿠폰함 설계 및 AWS 아키텍처 검토 (Day 111)
-
LLM 엔지니어링 및 한국어 모델 학습 환경 구축 참고 자료
-
MWW 한국어 STT 배포 및 SIMS Backend 아키텍처 검토
-
제한 테스트
-
FastAPI 학습
-
오프라인 디코딩 아키텍처 비교
-
Day 1132: Airgap 환경 구축 및 GPU Operator 배포 시도
-
KISA STT 솔루션 설치 및 환경 구성 (Day 1573)
-
Homura-Dan 라이센스 서버 아키텍처 및 RTFx 성능 벤치마크
-
ITN 서비스 배포 및 VAD 통합 구성 검토
-
Docker-in-Docker (DinD) 환경 설정 및 패턴 이스케이프 이슈
-
Triton-Kaldi 오프라인 디코더 아키텍처 설계 및 구현 계획
-
WSL 환경 구축 및 AI 개발 스택 설정
-
일본어 TTS 데이터 전처리 및 학습 구성안
-
Day 665: ITN 모델 배포 장애 및 환경 정리
-
2024-09-26: AI 연구 전략, Llama 3.2 및 로컬 LLM 도구
-
AI 채팅 및 음성 도구 목록
-
프로나이아(Pronaia) 일본 배포 및 API 접근 제어 아키텍처 논의
-
주소 모델 개발 현황
-
모델 서빙 아키텍처 논의
-
Day 250: Rescore 구현 완료 및 Triton-Kaldi 환경 구축 삽질
-
릴단 파드 및 Triton Server 배치 구성 (Helm Values)
-
Pronaia STT 환경 설정 및 특허 미팅 기록 (Day 917)
-
ASR 방향성 회의 및 3i4k 환경 구축 삽질
-
Triton-Kaldi 백엔드 구조 학습 및 커스텀 백엔드 빌드 방법
-
Day 61 (2021-08-30) - ReturnZero 일지
-
팩맨TF 및 dadumi-worker 아키텍처 리팩토링 고려사항
-
맞춤법 데이터 구조 및 토크나이징 전략 논의
-
S2 리빌드 문서화 및 다국어 RTFx 측정 환경 구축
-
자바스크립트 및 머신러닝 관련 도서 목록
-
2023-09-07 작업 기록: 일본어 ASR 모델 학습 및 MWW 업무
-
2026-02-03 업무: 일본어 ASR 모델 개선 및 Triton 배포 환경 최적화
-
온프레미스 Triton 엔진 동시처리 검증 및 Envoy LB 구성
-
ITN 개발 및 에이전트 아키텍처 논의 (Day 680)
-
rt-gec 토크나이저 이슈 및 일본어 ITN 학습 데이터 가이드라인
-
Kiwi 형태소 분석기 모델 학습 및 데이터 변환 프로세스
-
ReturnZero Day 1134: 에어갭 환경 구축 및 MWW 오류 대응
-
쿠폰 시스템 리팩토링 및 마이그레이션 (Day 174)
-
ReturnZero Day 1147: AM 모델 학습 API 테스트
-
2020-06-18 일기: 건강 관리 실패, 에어컨 청소, ML 학습 환경 구축 및 성능 평가
-
dadumi 버그 수정 및 Pronaia API 구조 분석
-
ReturnZero Day 582: 워크플로우 연동 및 Triton 배포 계획
-
Triton Ensemble 구현 및 NLP4STT 띄어쓰기 이슈
-
ChatGPT-4o, 음성인식 및 관련 기술 탐색
-
2024-04-30 일기: Jetson Nano LLM 실험과 개인적 소감
-
Triton-Kaldi Offline Decoder 리팩토링 및 TTS 학습 진행 상황 (Day 259)
-
ReturnZero Day 594: 일본어 데이터 파이프라인 및 ITN 아키텍처 검토
-
2026-02-26 업무 일지: 일본어 ASR 개선 및 S2 리빌드
-
Gemma2 기술 검토
-
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
-
긴 입력 처리 아키텍처 검토 (Day 586)
-
일본어 데이터 전사 이슈 및 두나무 로깅 아키텍처
-
Pronaia Engine 필터링 및 아키텍처 도식화 (Day 1044)
-
AncomCluster 인프라 구성 및 서비스 배포 가이드
-
일단 합쳤다가 풀기 (Batch Processing & Async Architecture)
-
CD 파이프라인 구축 계획
-
Primary Voice Isolation(PVI) 평가 환경 구축 및 신한 SDK 16kHz 대응
-
팀벨 개발 환경 설정 및 SIMS 배포 준비 (Day 959)
-
ReturnZero Day 7: 서버 환경 세팅 및 DB 스키마 논의
-
2023-05-12 일본어 모델 학습 및 얼라인, ITN 서비스화 진행 상황
-
GoP 레시피 분석 및 CPU 온라인 디코더 아키텍처 검토
-
Triton-Kaldi 디코딩 아키텍처 분석 및 iVector 적응 개념 탐구
-
Day 181: 배포 장애 대응 및 Triton 서버 학습 계획
-
어드민 디스코드 웹훅 연동 및 행렬 거듭제곱 알고리즘 학습
-
MMT 및 스트리밍 아키텍처 연구 방향성 (진홍 선배 논의)
-
Kiwi 형태소 분석기 학습 데이터 확보 및 일본어 ITN 개발 현황
-
일본어 TTS 기반 학습 및 주소 전사 실험 노트
-
MWW EKS 환경 접속 및 배포 준비 (Day 1153)
-
Day 106: 지급형 쿠폰 기능 개발 및 알고리즘 학습
-
Vito STT 성능 벤치마킹 및 환경 설정 기록 (2024-07-01)
-
논문 발표자료 구성 및 실험 설계 전략
-
워커 3단 배포 전략 및 차트 개발 현황
-
Parquet 오디오 데이터 추출 및 전처리 스크립트
-
Whisper 실시간 스트리밍 솔루션 탐색
-
오프로딩: 속도 할당 및 유틸리티 함수 설계
-
Excalidraw Drawing (2026-01-01)
-
ReturnZero 빌드 및 환경 설정
-
Recall) 이해 및 HuggingFace Transformers 학습 코드 분석
-
ReturnZero Day 764: 헬름차트 변경 및 배치 처리 아키텍처 논의
-
2017-07-24 일지: 최적화 문제 재정의 및 일상 기록
-
한국어 모델 업데이트 및 ITN 테스트 환경 준비
-
MWW PoC 환경 구축 및 일본 PoC 진행 현황
-
pynini 학습 노트
-
2017-06-13: boomerang.js 분석 및 분산 처리 미들웨어 구상
-
Triton Export 및 버전 호환성 문제
-
WFST 최적화 및 결정화 알고리즘 검토
-
dadumi lang 포함
-
RSVP의 어원 및 2024년 3월 26일 일기
-
CLI 도구 숙달을 통한 업무 효율성 향상
-
2022-02-16 일기: 업무 성찰 및 Continual Learning 참고
-
STT-LLM-TTS 챗봇 기술 스택 및 설정 초안
-
HifiGAN) 학습 현황
-
두나무 프로젝트 EKS 환경 구축 및 패킹 스크립트 점검
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
2024-01-30 일지: 개인 목표 실패 및 Helmchart 구성 검토
-
2017-06-26 일지: 이더리움 손절 및 distributed-workerpool 개발
-
MWW 스크럼: AWS 인스턴스 시뮬레이션 환경 구축
-
Day 63 (2021-09-01): Vito Admin 수정 및 배포 환경 문제
-
2024-09-30 업무 일지: 신한카드 및 서울소방재난본부 프로젝트 진행 상황
-
Day 1015: 음성 전처리 교정 및 LLM 임베딩 학습
-
알고리즘 학습
-
축공강)
-
Callabo STT 성능 개선 및 일본어 Qoo10 데이터 얼라인 전략
-
BERT 모델의 ONNX 변환 및 Triton Server 배포 시도 (Day 559)
-
GEC 모델 ONNX 변환 및 NLP4STT 진행 상황
-
프로나이아 모델 배포 및 스마트 어터런스 처리 로직 설계
-
WFST 엔진 구현 및 토큰 파싱 로직 설계
-
Triton-Kaldi ASR 파이프라인 개선 및 스트레스 테스트 계획
-
2025-10-16 업무: 일본어 STT 실험 및 KISA 프로젝트 준비
-
ReturnZero Day 1489: utterance 암호화 구현 및 Next Model(일본어) 탐색
-
ReturnZero Day 147: 쿠폰함 개발 및 Go 에러 처리 패턴 고민
-
AI 에이전트 논의
-
2025-06-09 일기: 미루기 습관 개선, LLM 추론 한계, 로컬 LLM 서빙
-
트레이더봇 부분체결 버그 및 LILAC 구현 고민
-
Kaldi ASR 모델 테스트 환경 설정 및 초기 실행 문제
-
현대캐피탈 차량번호 인식 모델 파인튜닝 및 SIMS 일본어 환경 구축
-
2025-09-30 업무 및 시스템 복구 현황