2022-02-17: 강화학습 및 지속적 학습 관련 자료 수집
Source
Basic Journals/Daily Journals/2022 임인년/임인년 48일, 2월 17일 목요일.md
Summary
이 노트는 2022년 2월 17일의 일기 형식을 띠고 있으나, 본문 내용은 비어있거나 미완성 상태입니다. 대신 강화학습(Reinforcement Learning, 특히 SAC 알고리즘)과 지속적 학습(Continual Learning, EWC, Progressive Neural Networks 등) 관련 논문, 코드 리포지토리, 블로그 포스트 등의 URL 목록만 나열되어 있습니다. 저자의 관심사가 RL 및 CL 분야에 집중되어 있음을 시사하지만, 구체적인 통찰이나 분석은 포함되어 있지 않습니다.
Key Points
강화학습(Reinforcement Learning) 알고리즘 중 Soft Actor-Critic(SAC) 관련 자료 수집
지속적 학습(Continual Learning) 기법(Elastic Weight Consolidation, Progressive Neural Networks 등) 관련 논문 및 구현체 링크 기록
일기 템플릿(부족했던 점, 성장했던 점 등)은 채워지지 않은 채 링크 목록만 남음
SAC (Soft Actor-Critic) 강화학습 소개
2022-02-16 일기: 업무 성찰 및 Continual Learning 참고
RL 트레이딩 전략 학습 및 검증 과정 (2024-05-02)
2024-04-17 일기: RL 학습 및 시스템 최적화 노트
강화학습 기본 개념 정리 및 의문점
강화학습 기반 암호화폐 자동매매 프로젝트 제안
어제를 사는 힘 (2025-12-19)
2024-05-19 일기: 라이코스 프로젝트 검토 및 문재인 정부 회고록 독서감상
RLHF(인간 피드백 기반 강화학습) 개요
2024-05-07 일기: 플로이드-워셜 알고리즘 학습
2024-04-19 일기: 과소비, 가족 지원, 강화학습(Ray RLlib) 학습
비트코인 상승장 구간 정의 및 데이터 수집 계획
2024-03-14 일기: 듀오링고 학습 및 yt-dlp 프록시 구축
LLM 엔지니어링 및 한국어 모델 학습 환경 구축 참고 자료
TensorTrade RL 최적 하이퍼파라미터 설정 (2024-04-28)
2024-05-09 일기: Duolingo, 미쿠복싱, 강화학습 디버깅
2024-04-18 일지: RL 학습 환경 구성 및 시스템 아키텍처 구상
강화학습 봇 재고
FreqAI 설정 및 커스텀 데이터 활용 가능성 탐구
RL 기반 주식 트레이딩 봇 설계: 에피소드 길이 및 데이터 고려사항
TD3 기반 주식 트레이딩 알고리즘 설계
AI 금융 및 알고리즘 트레이딩 참고 문헌
Trade-Agent 검증 및 스캘핑 전략 검토
KOF99 네스츠 데이터 기반 AI 학습 아이디어
RLLib 얼라인: 학습 코드 검토 및 Google Trends 데이터 검증
Stock Trader 이벤트 리스너 및 시뮬레이션 설정
TensorTrade 2.0 적용 및 RL 에이전트 디버깅
Ray RLlib PPO 트레이딩 환경 초기화 오류 (Gymnasium API 호환성)
2024-05-14 일기: AI 생존 고민 및 디퓨전 모델 학습 특성
청자 기술 학습
TentTrade 2.0 마이그레이션 장애요인 및 핵심 요구사항
데이터 랜덤픽 구현 및 라이브 피드 아키텍처 설계
스트림 구현 및 아키텍처 고민
TensorTrade 라이브 피드 구현의 기술적 장벽과 개발자 심리
2023 년 1 월 3 일 일기: 개인적 반추 및 지식 증류 학습
Rustdesk 연동 성공 및 Tailscale 활용
Tensortrade의 Gymnasium 및 Ray 호환성 개선
임인년 189일, 7월 8일 금요일
2024-05-17 일기: Llama 3 양자화 가이드 및 일본어 데이터셋 수집
WSL)
2024-04-30 일기: Jetson Nano LLM 실험과 개인적 소감
멀티뷰 학습 및 vLLM 서빙 엔진 탐색
AI 에이전트 논의
2024-09-26: AI 연구 전략, Llama 3.2 및 로컬 LLM 도구
갑진년 15일, 1월 15일 월요일
AncomBase 아이디어 백로그: 가격 예측, 드걸 부활, 서적관리
AI 프리랜서 관련 참고 링크
2025-06-09 일기: 미루기 습관 개선, LLM 추론 한계, 로컬 LLM 서빙
2024-07-25 일기: 정보 정제와 뉴스 타임라인
AI 채팅 및 음성 도구 목록
자바스크립트 및 머신러닝 관련 도서 목록
가위바위보 기반 AI 소개팅 게임 앱
자비에 NX 구매 고민 및 가격 불만
2021-07-06 일기: 전기자전거 및 라즈베리파이 NAS 구상
Jetson Nano 클러스터 기반 TensorTrade 병렬 학습 환경 구축
루리웹 및 Rebrn 링크 모음 (2023-10-20)
2023-10-20T05_34_14.038+09_00
Related Notes
ChatGPT-4o, 음성인식 및 관련 기술 탐색
하코네 여행 경비 및 일본어 학습
2020-06-17 일기: 생활 관리 및 학습 기록
2024-05-27 일기: 디지털 리터러시 교육 및 생활 습관 성찰
2019-02-26: 전민동 거주 반 년 및 출구 전략 고민
Z-Image 기술 동향 및 AI 도구 메모
2024-10-14 일기: 육체 관리, 60갑자 계산법, LLM 파인튜닝 기술 동향
CG 링크 목록
로컬 AI 환경 구축과 그 의미에 대한 성찰
Dustin Tran 관련 트윗 참고
2021-01-18 일기: 워쉽, 독서, 젯슨 나노 문제
2021-03-22 일기: 생활 기록 및 기술적 고민
2025-03-11 일기: 클러스터 운영 주의사항 및 개인 기록
Node Exporter 설치 및 학습 환경 메모리 문제
CD 파이프라인 구축 계획
현택의 블록체인 기반 데이터 거래 모델 고찰
RSVP의 어원 및 2024년 3월 26일 일기
독서 목록 (Archive)
Triton Custom Backend 학습 계획 및 모델 웜업 개념 정리
Whisper 실시간 스트리밍 솔루션 탐색
Qwen3.5-122B 로컬 배포 및 Jetson Thor 업그레이드 기록
2026-04-22 일기: Rust 학습 고민 및 식물 분양 논의
GPU 오퍼레이터 설치 및 Air-gapped 환경 구축 준비
빅데이터의 적용 분야 및 모델링 통찰
2025 년 10 월 20 일 일기: 가사 지원 및 생활 기록
GitHub Copilot Chat Rules
일본어 TTS 데이터 전처리 및 학습 구성안
Day 904: STT 학습 기능 논의 및 배포 준비 (2023-12-21)
배포 워크플로우 논의 (Day 859)
프롬프트 예제 (Lunatic Theme)
Deview 2023 1일차 키노트 및 세션 요약 (네이버, 쏘카, Clova OCR)
Edge 디바이스 LLM 배포 연구
2024-01-23 일기: 일상 수행 및 글쓰기 고민
2023-08-08 작업 일지: 일본어 학습, MWW 배포, Dadumi
배포 테스트 (2024-09-11)
Stock Trader 데이터 준비 및 아키텍처 검토
Stable Diffusion 관련 리소스 및 프롬프트 예시
개인 위키 시스템 구축 요구사항 및 기술 스택 고려사항
개인정보 수집 오남용 및 연구 방법론 검토 (2023-10-20)
rt-gec 토크나이저 이슈 및 일본어 ITN 학습 데이터 가이드라인
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
2020-12-17: 재택근무 어려움, 강화학습 실패, 라즈베리파이 하드웨어 문제
폰 데이터 이전 및 정리 체크리스트
WSL 환경 구축 및 AI 개발 스택 설정
ReturnZero Day 1147: AM 모델 학습 API 테스트
2023-09-07 작업 기록: 일본어 ASR 모델 학습 및 MWW 업무
Excalidraw Drawing (2026-01-01)
2023 년 2 월 3 일 일기: 1 월 회고 및 최근 생활 기록
네트워크 전공자 필수 지식 목록 (초안)
2020-06-18 일기: 건강 관리 실패, 에어컨 청소, ML 학습 환경 구축 및 성능 평가
Day 937: 다드미 버그 수정, 일본어 데이터 수집, 특허 보완
기술 트렌드 수집
2023-05-12 일본어 모델 학습 및 얼라인, ITN 서비스화 진행 상황
Triton-Kaldi 백엔드 구조 학습 및 커스텀 백엔드 빌드 방법
CentOS 7 기반 NVIDIA GPU 환경 구축 및 모델 배포 준비
폐쇄망(Air-gapped) Kubernetes 환경 구축 및 도구 평가
2026-01-12 일지: Docker 빌드 및 NFS 언마운트 팁
Stable Diffusion 파인튜닝 및 LLM 환경 구축 기록
2020-07-03 일기: 생활패턴 및 미밴드 5
축공강)
Kiwi 형태소 분석기 학습 데이터 확보 및 일본어 ITN 개발 현황
Gemma2 기술 검토
일본어 ASR 모델 학습 및 데이터 전처리 진행 상황 (2024-07-15)
2024-09-25 일기: 목표 설정, 중도 포기 심리, 지방 의료, AI 모델 목록
Triton-Kaldi Offline Decoder 리팩토링 및 TTS 학습 진행 상황 (Day 259)
Kiwi 형태소 분석기 모델 학습 및 데이터 변환 프로세스
FastAPI 학습
어드민 디스코드 웹훅 연동 및 행렬 거듭제곱 알고리즘 학습
pynini 학습 노트
맞춤법 데이터 구조 및 토크나이징 전략 논의
연구 아이템 (KAIST MNLab)
RustDesk Self-Hosted Configuration
2024-08-06 새벽 일기: 생활 정리 및 기술적 성찰
Recall) 이해 및 HuggingFace Transformers 학습 코드 분석
HifiGAN) 학습 현황
알고리즘 학습
Pro14 (MT6735) 디바이스 정보 수집 및 일상 기록
어미 처리 실험
일본어 TTS 기반 학습 및 주소 전사 실험 노트
팀벨(Timbel) 개발 환경 구축 및 라이선스 발급 기록
WFST 최적화 및 결정화 알고리즘 검토
Day 1132: Airgap 환경 구축 및 GPU Operator 배포 시도
Parquet 오디오 데이터 추출 및 전처리 스크립트
Jetson Nano 2GB SDK Manager 및 USB 인식 문제
Jetson Nano에서 Stable Diffusion 실행 환경 구성 시도
생활 정리
어제를 사는 힘 (2026-05-26)