이 노트는 NVIDIA Jetson 기기에서 대규모 언어 모델(LLM, 20b/120b)을 vLLM으로 실행할 때 겪은 기술적 문제와 해결 과정을 기록한 일기 형식의 메모입니다. 핵심 문제의식은 vLLM 프로세스 종료 후에도 GPU 메모리 캐시가 해제되지 않아 시스템 리소스가 고갈되는 버그입니다. 이를 해결하기 위해 텍스트 모드로 전환하고 sysctl -w vm.drop_caches=3 명령어를 사용하여 캐시를 강제로 정리하는 방법을 적용했습니다. 또한 120b 모델 로딩 시 긴 대기 시간과 공유 메모리 브로드캐스트 타임아웃 오류를 경험했으며, 다양한 최신 AI 모델(TTS, Image Gen, VLM, LLM) 링크를 수집한 내용도 포함되어 있습니다.
-
Qwen3.5-122B 로컬 배포 및 Jetson Thor 업그레이드 기록
-
2024-04-30 일기: Jetson Nano LLM 실험과 개인적 소감
-
Triton GPU OOM 문제 및 팀 전환 초기 적응
-
Gemma2 기술 검토
-
Triton Kaldi 서빙 시 메모리 누수 및 크래시 디버깅
-
2026-01-12 일지: Docker 빌드 및 NFS 언마운트 팁
-
리눅스 LVM 볼륨 확장 절차
-
Triton 서버 구축 및 pysommers 데이터 전처리
-
Node Exporter 설치 및 학습 환경 메모리 문제
-
CentOS 7 기반 NVIDIA GPU 환경 구축 및 모델 배포 준비
-
Jetson Nano 2GB SDK Manager 및 USB 인식 문제
-
Kaldi ASR 모델 테스트 환경 설정 및 초기 실행 문제
-
CentOS 7 환경에서 Docker 및 NVIDIA 드라이버 설치 시도 (실패 및 의존성 문제)
-
Jetson Nano에서 Stable Diffusion 실행 환경 구성 시도
-
Jetson Nano 클러스터 기반 TensorTrade 병렬 학습 환경 구축
-
Stable Diffusion 모델 체크포인트 링크
-
Edge 디바이스 LLM 배포 연구
-
OpenStack Neutron VXLAN 및 Calico VXLAN MTU 설정 문제
-
Stable Diffusion WebUI Docker 환경 구축 및 에러 해결 기록
-
Triton Kaldi 메모리 누수 및 성능 저하 문제 분석 (Day 229)
-
GPU 오퍼레이터 설치 및 Air-gapped 환경 구축 준비
-
Docker-in-Docker (DinD) 환경 설정 및 패턴 이스케이프 이슈
-
Triton-Kaldi 서버 성능 저하 및 GPU 메모리 이슈 분석
-
Jetson Nano 구매 의도 및 라즈베리 파이 4 구동 고민
-
Kaldi 메모리 오버플로우 및 WER 100% 성능 붕괴 원인 분석
-
WSL)
-
Stable Diffusion 관련 리소스 및 프롬프트 예시
-
Triton-Kaldi GRPC 연결 실패 및 클라이언트 호환성 문제
-
Triton Server 기반 Kaldi ASR 배포 시도 및 환경 문제
-
Triton Inference Server 성능 저하 및 메모리 누수 원인 분석
-
CUDA install
-
로컬 AI 환경 구축과 그 의미에 대한 성찰
-
Triton-Kaldi ASR 성능 벤치마킹 및 메모리 이슈 분석
-
MR 컴퓨팅 환경 고찰
-
Triton Kaldi ASR 클라이언트 메모리 폭주 및 성능 저하 디버깅
-
Stable Diffusion 파인튜닝 및 LLM 환경 구축 기록
-
SAC 알고리즘의 GPU 최적화 및 성능 병목 분석
-
Raspberry Pi 클러스터 구축 및 스토리지 고민
-
Envoy 로드밸런싱 아키텍처 재고 및 GPU 운영 환경 정리
-
Triton-Kaldi 컨테이너 버전 업그레이드 및 성능 관찰
-
MWW 스크럼: AWS 인스턴스 시뮬레이션 환경 구축
-
KubeDNS 대용량 클러스터 부하 처리 문제 및 해결 방안
-
CD 파이프라인 구축 계획
-
Realtek 네트워크 드라이버 설치 및 Netplan DHCP 설정 가이드
-
방화벽 문제 해결 시도
-
Rocky Linux 환경 Docker 및 Triton Server 이미지 설정
-
프롬프트 예제 (Lunatic Theme)
-
WSL 환경 구축 및 AI 개발 스택 설정
-
LLM 엔지니어링 및 한국어 모델 학습 환경 구축 참고 자료
-
nerdctl 및 BuildKit 설정 가이드
-
Whisper 실시간 스트리밍 솔루션 탐색
-
Day 1132: Airgap 환경 구축 및 GPU Operator 배포 시도
-
SUJ-298 메일 전송 설정 및 클라이언트 호환성 문제 (2021-07-26)
-
Raspberry Pi 3 기반 k3s 및 스토리지 서비스 구축 계획
-
Jetson Thor 부팅 실패 복구 및 초기 설정
-
RustDesk Self-Hosted Configuration
-
공유기 네트워크 설정 및 NTP 문제 해결 참고 링크
-
Nextcloud Kubernetes Ingress 설정
-
임인년 148일, 5월 28일 토요일.
-
Abomikluster: 이종 아키텍처 Kubernetes 클러스터 구성
-
오일 파스텔 DIY 염료 제작법
-
폐쇄망(Air-gapped) Kubernetes 환경 구축 및 도구 평가
-
OVMS 컨테이너 Segmentation Fault (Exit Code 139)
-
RTZR STT 서비스 K8s 네트워킹 문제 해결
-
RPI 클러스터 인프라 상태 및 Nextcloud 외부 접속 문제
-
인프라 환경 재정비 및 NAS 스토리지 구성
-
Day 957: 주소모델 실험 및 Kubernetes GPU 환경 설정
-
Triton Server 헬름 차트 배포 및 모델 로딩 오류
-
Traefik)
-
gRPC Insecure 연결 문제 및 STT API 통합 문의
-
Triton Export 및 버전 호환성 문제
-
Triton Python Backend 예제 실행 및 구조 분석
-
Triton 서비스 확장 및 Helm Chart 문제
-
NAS 스토리지 확장 및 NFS 문제 해결
-
Triton Custom Backend 학습 계획 및 모델 웜업 개념 정리
-
E2E ASR 모델 Triton 서빙 환경 구축 및 테스트 (Day 723)
-
AWS CLI 환경 설정 및 Triton Server 배포 준비
-
개인 위키 시스템 구축 요구사항 및 기술 스택 고려사항
-
ancom21c.rt
-
AI 이미지 생성 도구 및 설정 노트 (2024-07-30)
-
T4 GPU 환경에서 WFST 모델의 성능 측정 (Day 876)
-
Triton-Kaldi GRPC 통신 분석 및 Sommers 모델 디버깅
-
Illustrious XL 및 일관성 있는 캐릭터 생성 워크플로우
-
NFS 서버 및 autofs 클라이언트 설정
-
GoModel API 연동 설정 및 사용법
-
주소 인식 모델 성능 검증 및 Triton 배포 전략
-
GEC 모델 ONNX 변환 및 NLP4STT 진행 상황
-
Triton 배포 및 모델 컴파일 파이프라인 정리 (Day 576)
-
NeuralITN TRT 변환 성공 및 Triton 포팅 과정
-
MWW-TMN 배포 및 인프라 문제 해결 (2025-10-21)
-
Istio 네트워크 문제 조사
-
Torch 의존성 제거 및 Triton 이미지 배포 작업 (Day 658)
-
Triton Inference Server 앙상블 배치 처리 검증
-
BERT 모델의 ONNX 변환 및 Triton Server 배포 시도 (Day 559)
-
MWW 일본어 주소 모델 성능 개선 및 WFS 문제 진단
-
Pronaia-Engine 코드 폴리싱 및 Triton Mel 성능 검증
-
운영 이슈
-
Day 555: ONNX 모델 배포 및 환경 구성 고민
-
Triton-Kaldi 오프라인 디코딩 및 Sommers 데이터셋 연동 문제
-
Trt) 시도 및 실패 기록
-
2023-01-05 일지: pysommers 배포 문제 해결, NLP4STT 띄어쓰기 모델 최적화 및 사업계획
-
워커 3단 배포 전략 및 차트 개발 현황
-
릴단 파드 및 Triton Server 배치 구성 (Helm Values)
-
Raspberry Pi 4 클러스터 (K3s) 구축 및 운영 기록
-
GOP 디코더 디버깅: iVector 차원 불일치 문제
-
일단 합쳤다가 풀기 (Batch Processing & Async Architecture)
-
ReturnZero Day 1139: 개발 환경 구축 및 시스템 장애 대응
-
2023-07-27 작업 계획: 일본어 모델 배포 및 Triton 설정
-
일본어 ASR 모델 디버깅 및 성능 비교 (Day 704)
-
띄어쓰기 모델 변환 및 성능 테스트
-
Triton-Kaldi 통합 테스트 및 팅커벨 사전 기능 설계 (Day 231)
-
ReturnZero Day 1134: 에어갭 환경 구축 및 MWW 오류 대응
-
Envoy 로드밸런싱 문제 해결
-
ReturnZero Day 903: 모델 최적화 시도 및 성능 벤치마크
-
ITN 모델 배포 및 성능 튜닝 (Day 666)
-
SIMS 모델 배포 및 게이트웨이 설정 작업
-
팀벨(Timbel) 개발 환경 구축 및 라이선스 발급 기록
-
Day 203: Sommers Dataset Testing & Detokenization Issues
-
ASR 모델 성능 평가 결과 (2023-10-02)
-
PII 영향 분석)
-
Triton Ensemble 구현 및 NLP4STT 띄어쓰기 이슈
-
Kaldi BigLM Rescoring 구현 및 하이퍼파라미터 튜닝
-
현대캐피탈 Triton 서버 빌드 및 성능 벤치마크 (Day 1112)
-
GPT-SoVITS 감정 표현의 무작위성 및 Gemini 3 평가
-
2025-06-09 일기: 미루기 습관 개선, LLM 추론 한계, 로컬 LLM 서빙
-
2024-05-17 일기: Llama 3 양자화 가이드 및 일본어 데이터셋 수집
-
배포 워크플로우 논의 (Day 859)
-
일본어 주소 인식 모델 배포 및 MWW STT 성능 검증
-
MWW EKS 배포 장애 및 STT 모델 평가 이슈 (Day 1168)
-
일본어 ASR 모델 평가 및 rt-itn 배포 기록
-
Triton-Kaldi Rescore Lattice Postprocessor 통합 및 빌드 이슈 해결
-
Kaldi VAD 트리밍 입력의 컨텍스트 처리 및 소머즈 후처리
-
축공강)
-
신한카드 K8s 방화벽 설정 및 모델 파이프라인 개선 고민
-
2024-07-22 업무 및 회고: 일본어 ASR 모델 평가 및 인프라 구축
-
ASR 모델 개선 및 프로젝트 진행 현황 (2026-05-07)
-
Day 1043: PII Redaction Filter 개발 및 On-Prem 모델 관리
-
멀티뷰 학습 및 vLLM 서빙 엔진 탐색
-
ReturnZero STT 솔루션 개발 및 모델 레지스트리 구조화
-
일본어 ASR 모델 훈련 성능 저하 관찰 (Day 1571)
-
일본어 ASR 파이프라인 구축 및 Forced Alignment 문제 해결 시도
-
BMT 모델 테스트 및 인프라 설정 (2024-01-05)
-
일본어 ASR 모델 성능 벤치마크 및 문제점 (2023-09-25)
-
주소 인식 모델 서빙 방식 결정: ONNX Dynamic vs TRT
-
온프레미스 Triton 엔진 동시처리 검증 및 Envoy LB 구성
-
ASR 성능 벤치마크 및 SER 이슈 분석 (2024-07-18)
-
2026-01-22 업무 및 모델 개선 이슈
-
출장 정리 및 이름 모델 개선 계획 (2023-11-14)
-
일본어 음성 인식 모델 테스트 결과 (2024-04-15)
-
PVI 성능 최적화 및 일본어 ASR 모델 개선 현황
-
PVI 및 일본어 ASR 모델 개선 현황 (2026-05-22)
-
2025-10-15 업무 및 일본어 ASR 모델 평가
-
2026-01-20 업무: 제로원 TTS 데이터 정제 및 일본어 STT 모델 배포 가이드
-
Triton-Kaldi ASR 파이프라인 개선 및 스트레스 테스트 계획
-
Day 205: 오프라인 디코더 비교 실험 및 화자분리 장애 대응
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-16)
-
배포 테스트 (2024-09-11)
-
주소 인식 모델 (Address Model) 성능 분석 및 트러블슈팅
-
Istio iptables 초기화 오류 해결 및 BMT 테스트 실행
-
2024-05-17 업무 기록: 키워드 부스트 모델 배포 및 개발 환경 설정
-
Qoo10 전사 오류 원인 분석 및 카타카나 모델 벤치마크
-
2023-09-07 작업 기록: 일본어 ASR 모델 학습 및 MWW 업무
-
Day 425: 환경 설정 문제 및 하이라이터 프로젝트 방향성
-
2026-05-21 업무: PVI 및 일본어 ASR 모델 개선 현황
-
2020-12-17: 재택근무 어려움, 강화학습 실패, 라즈베리파이 하드웨어 문제
-
한국어 TTS 정규화 모델 개발 및 일본어 ASR 개선 현황
-
Pronaia Engine Keyword Boosting 모델 전사 테스트 및 배포 준비
-
Day 665: ITN 모델 배포 장애 및 환경 정리
-
ITN 모델 최적화 및 데이터 전처리 작업 기록
-
MWW 배포 및 ASR 파이프라인 디버깅 (2024-03-12)
-
어제를 사는 힘 (2026-05-26)
-
MWW 한국어 STT 배포 및 SIMS Backend 아키텍처 검토
-
Day 491: E2E 음성 인식 서버 배포 장애 및 Kaldi 대체안 검토
-
Triton Custom Backend 세미나 준비 및 GoP Decoder 정리
-
Triton-Kaldi 통합 및 Kaldi 레시피 구조 분석 (Day 190)
-
MWW EKS 배포 장애 및 RT-Annotation 문서화 개선
-
Szurubooru 배포 및 설정 메모
-
일본어 STT 모델 배포 준비 및 성능 평가 (Day 838)
-
2023-05-12 일본어 모델 학습 및 얼라인, ITN 서비스화 진행 상황
-
프로나이아 모델 배포 및 스마트 어터런스 처리 로직 설계
-
일본어 ASR 모델 학습 및 데이터 전처리 진행 상황 (2024-07-15)
-
2026-01-21 업무: 제로원 TTS 데이터 정제 실패 및 일본어 STT 모델 개선 계획
-
PVI 모델 개선 및 일본어 ASR 이슈 분석
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-19)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-13)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-02-27)
-
VITO 요약 회의 및 RoBERTa 의도 분석 모델 논의
-
2025 년 3 월 10 일 일기: 건강 관리 실패와 기술적 문제 해결
-
TTS 모델 개선 및 S2 리빌드 진행 상황
-
2024-07-19 ASR 모델 벤치마크 결과 (Alphanumeric)
-
어제를 사는 힘 (2025-02-12)
-
2024-04-29 일기: 건강 관리 및 기술적 문제 해결
-
Triton-Kaldi 컴파일 장애 및 RescoreLatticePostprocessor 심볼 오류
-
Triton-Kaldi 오프라인 전환 및 백엔드 구조 분석
-
Kubespray 오프라인 환경 설정 및 NFS 프로비저너 배포 작업
-
Z-Image 기술 동향 및 AI 도구 메모
-
일본어 ASR 모델 실험 및 데이터 파이프라인 개선 (Day 811)
-
TTS 모델 개선 및 S2 리빌드
-
TTS 모델 개선 및 S2 리빌드
-
RTZR 일본어 ASR 개발 이력 및 모델 레지스트리 구조
-
전처리 이슈
-
맥북 프로 A2338 백라이트 및 전원 부팅 문제 수리 기록
-
ReturnZero Day 814: 일본어 모델 학습 속도 문제 및 해결
-
GoP(Goodness of Pronunciation) 평가 파이프라인의 C++ 바이너리화 및 Feature Pipeline 문제
-
2022-06-20 워크샵 및 모델 실험 기록
-
한국어 모델 업데이트 및 ITN 테스트 환경 준비
-
RL 모델 서빙 고민
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-06)
-
일본어 ASR 모델 (Cutoff) 벤치마킹 및 배포 준비
-
ReturnZero Day 1147: AM 모델 학습 API 테스트
-
다듬이: Turn 기반 처리 파이프라인 재설계 및 Pandas 인덱스 문제
-
TTS 모델 개선 및 S2 리빌드 진행
-
2026-02-03 업무: 일본어 ASR 모델 개선 및 Triton 배포 환경 최적화
-
2026-01-19 업무: 제로원 TTS 데이터 파이프라인 및 일본어 ASR 모델 개선
-
2026-01-14 업무 및 일본어 모델 배포 준비
-
일본어 STT 모델 벤치마킹 및 인프라 작업 기록 (2025-01-14)
-
2024-08-05: PC 하드웨어 문제 해결 및 주변기기 구매
-
mww 운영계 배포 아키텍처 및 구성 요소
-
업라이즈 AI바우처: 금융 콘텐츠 요약 서비스 및 NLP4STT 기술적 장애물
-
스케줄링 이슈
-
홈서버 인프라 현황 및 개선 계획
-
AncomCluster 인프라 구성 및 서비스 배포 가이드
-
Raspberry Pi 3 기반 IP 카메라 스트리밍 및 AI 추론 아키텍처
-
2024-09-26: AI 연구 전략, Llama 3.2 및 로컬 LLM 도구
-
TensorTrade RL 최적 하이퍼파라미터 설정 (2024-04-28)
-
ITN Triton 통합 배포 및 스레드 풀 문제
-
ASR 모델 개선 현황: PVI, 일본어, MWW 화물맨
-
ReturnZero Day 1765: PVI 및 일본어 ASR 모델 개선 현황
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
ReturnZero Day 1643: 모델 레지스트리 구조화 및 전사 장애 분석
-
2024-09-19 업무: 일본어 STT 모델 튜닝 및 Prefix Decoder 디버깅
-
일본어 ASR 모델 성능 검증 및 디버깅 (Day 708)
-
PVI 최적화 및 일본어 ASR 모델 개선 현황 (2026-04-29)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-04)
-
2026-01-28 업무: 일본어 ASR 모델 개선 및 데이터셋 구축
-
2024-11-29 업무 기록: 일본어 모델 개선 및 PII 버그 수정
-
2025-11-05 업무: 오뚜기 모델 평가 및 L40S Whisper 일본어 성능 검증
-
Toleration, GPU 환경 점검
-
SIMS 개발계 배포 및 Envoy gRPC 로드밸런싱 설정
-
ReturnZero STT 서비스 K8s 배포 및 Triton Server 연동 작업 (Day 748)
-
ReturnZero Day 582: 워크플로우 연동 및 Triton 배포 계획
-
Day 490. 2022-11-02
-
Python Client 초기 배포 및 구조 검토 (Day 358)
-
Day 329. 2022-05-25
-
Triton-Kaldi 오프라인 디코더 구현 및 Triton 배치 처리 분석
-
Day 250: Rescore 구현 완료 및 Triton-Kaldi 환경 구축 삽질
-
Day 239. 2022-02-24
-
Triton-Kaldi 백엔드 구조 학습 및 커스텀 백엔드 빌드 방법
-
Primary Voice Isolation (PVI) 파이프라인 개선 및 일본어 ASR 모델 이슈
-
Triton 이미지 교체 및 Pronaia Engine 배포 작업
-
MWW 일본어 배포 및 가독성 평가 실험 (2024-07-24)
-
STT 실시간 엔진 배포 가이드 및 데이터셋 전처리 현황
-
화물맨 ASR 도메인 특화 및 일본어 모델 개선 현황
-
PVI 성능 개선 및 일본어 ASR 모델 이슈 분석
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 계획
-
TTS 모델 개선 및 제로원 준비
-
2026-01-16 업무: 두나무 STT 연동 장애 및 일본어 모델 개선
-
신한카드 프로젝트: GPU 모니터링 및 화자분리 파이프라인 구축 검토
-
ReturnZero Day 1047: 일본어 ASR 모델 검증 및 성능 분석
-
일본어 STT 개발계 배포 및 벤치마크 실행 기록 (Day 872)
-
Kiwi NLP 모델 빌딩 및 데이터 전처리 작업 기록
-
PVI 최적화 및 일본어 ASR 모델 개선 현황 (2026-05-06)
-
Kiwi 모델 빌더 세그먼트 폴트 디버깅 및 ITN 초기 조사
-
2026-02-08 업무: 일본어 ASR 모델 개선 및 웰컴 프로젝트 인프라 구축
-
2025-11-04 업무: L40S Whisper 실시간 성능 검증 및 MWW 모델 훈련
-
일본어 Cutoff 모델 배포 준비 및 Partial 응답 속도 검증
-
현대캐피탈 차량번호 인식 모델 파인튜닝 및 SIMS 일본어 환경 구축
-
일본어 ITN 테스트 및 데이터 문제 확인
-
Day 1143: 업무 및 기술적 문제 해결 기록
-
2025-03-24 일기: 건강 관리 및 RAG 메모리 고찰
-
MWW 한국어 SIMS 평가 및 커넥션 릭 재현 테스트
-
테스트 진행 상황 (Day 965)
-
SIMS 헬름 구성 및 파이프라인 자동화 고민
-
MWW 한국어 개발계 배포 및 기술적 장애 대응 (2023-11-15)
-
Day 727: vitoworker 테스트 복구 및 PoC 준비
-
fp16 테스트 실패 및 배포 작업 기록
-
Triton-Kaldi Offline Decoder 리팩토링 및 TTS 학습 진행 상황 (Day 259)
-
Day 253: Vito-kaldi 리팩토링 및 Triton-kaldi 반영
-
Triton-Kaldi 디코딩 파이프라인 분석 및 Sommers 후처리 장애
-
한국어 TTS 텍스트 정규화(TN) 경량 모델 개발 진행 상황 (2026-02)
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
SIMS 환경 설정 및 최적화 (Day 1202)
-
ReturnZero Day 1118: 음성 인식 전사 오류 및 WFST 디코더 호환성 문제
-
Tensortrade의 Gymnasium 및 Ray 호환성 개선
-
Stock Trader 이벤트 리스너 및 시뮬레이션 설정
-
일본어 qoo10 음성 전사 및 정렬 문제 해결 시도
-
2026-01-29 업무: 일본어 ASR 모델 개선 및 제로원 데이터 이슈
-
ReturnZero Day 1644: 모델 레지스트리 구축 및 웰컴용 STT 패키징
-
ReturnZero Day 1625: 웰컴용 Translator 패키징 및 일본어 모델 개선
-
일본어 STT 모델 튜닝 및 팀벨 서비스 장애 대응
-
Pronaia 온프레미스 세미나 준비 및 데이터 파이프라인 문제 해결
-
2024-05-14 일기: AI 생존 고민 및 디퓨전 모델 학습 특성
-
2024-09-25 일기: 목표 설정, 중도 포기 심리, 지방 의료, AI 모델 목록
-
ReturnZero Day 860: STT 모델 수정 및 성능 벤치마크
-
ReturnZero Day 858: Confidence Score 적용 및 모델 변경
-
Day 303: 모델 이미지 재배포 및 TTS 연구 시작
-
PVI 모델 최적화 및 일본어 ASR 개선 현황 (2026-05-27)
-
현대캐피탈 고도화: 취약점 패치 및 다중 모델 평가 환경 구축
-
다듬이 및 일본어 모델 처리 논의 (Day 642)
-
이메일 인코딩 문제 해결 시도 (2021-08-13)
-
Project-K 지역락 이슈 및 모델 이미지 재퍼블리시
-
모델 레지스트리 구조화 및 배포 자동화
-
RTZR-STT 패키징 자동화 및 모델 레지스트리 설계
-
서고 관리 동기 및 문제 인식
-
일본어 음성 인식(ASR) 전사 파이프라인 디버깅 및 경량화 시도
-
MWW 배포 회고 및 테스트 데이터셋 구성 전략
-
Day 875. 2023-11-23
-
Sandbox BMT 테스트 환경 구성 및 설정
-
대방 방문 작업 목록 및 기술적 이슈 (2023-08-16)
-
MWW PoC 환경 구축 및 일본 PoC 진행 현황
-
Day 589. 2023-02-09
-
2022-05-18 일일 작업 기록: 서베이 및 배포 프로세스 개선 논의
-
Day 315. 2022-05-11
-
출력 파이프라인 정리 및 Protobuf 정의 시도
-
Day 265: Vito-Kaldi 디코더 구조 분석 및 오프라인 디코딩 미완료
-
Triton-Kaldi Offline Decoder 설계 및 HifiGAN 연구
-
HifiGAN) 학습 현황
-
rt-tokenizer CLI 구현 및 백엔드 디토크나이징 파이프라인 적용
-
SIMS 0.4.0 배포 시험 및 설정 검토
-
팀벨(Timbel) 평가(Eval) 시스템 디버깅 및 인프라 설정
-
ReturnZero Day 1061: STT 엔지니어링 및 평가 현황
-
RL 트레이딩 전략 학습 및 검증 과정 (2024-05-02)
-
NLP 문제 정의
-
안정성 문제 해결
-
RTZR 일본어 STT 개발 이력 및 모델 레지스트리 구조
-
2025-10-13 업무: 일본어 STT 모델 검증 및 제로원 제안서 초안
-
SIMS 일본어 설치 및 현대캐피탈 모델 고도화 진행 상황
-
GOP 프로젝트: ivector 문제 탐색 및 도커 배포 준비 (Day 299)
-
Steam 병행 실행)
-
2025-05-12 일기: 대전 나들이 및 GPU 구매 고민
-
Recall) 이해 및 HuggingFace Transformers 학습 코드 분석
-
2025-09-16 일본어 모델 배포 및 설정 작업
-
Day 942: vito-worker 배포 및 STT 파이프라인 설정
-
Day 902: Audio Feature Extraction & Model Check
-
qoo10 일본어 서버 재가동 및 헬름차트 설정
-
Homura-Dan 라이센스 서버 아키텍처 및 RTFx 성능 벤치마크
-
ReturnZero Day 532: Kiwi 모델 검증 및 일본어 숫자 태깅 규칙 분석
-
2022-07-11 일일 작업 기록: Pynini 트랜스듀서 디버깅 및 MariaDB 환경 설정
-
2026-05-28 업무 및 기술 이슈 요약
-
S2 리빌드 및 다국어 RTFx 측정 (2026-03-11)
-
S2 리빌드 문서화 및 다국어 RTFx 측정 환경 구축
-
TTS 개선 및 S2 리빌드
-
일본어 코드모델 (파나소닉 모델명 인식)
-
Rustdesk 연동 성공 및 Tailscale 활용
-
RLHF(인간 피드백 기반 강화학습) 개요
-
Kiwi 형태소 분석기 모델 학습 및 데이터 변환 프로세스
-
Day 516. 2022-11-28: Kiwi 모델 구축 API 화 및 콜라보 하이라이터 프로토타이핑
-
ASR 모델 개선 현황: PVI, 일본어, 화물맨 도메인
-
ReturnZero Day 1645: 모델 레지스트리 및 웰컴용 STT 패키징 진행
-
현대캐피탈 고도화 및 일본어 모델 개발 진행 상황 (Day 1524)
-
일본어 이름 모델 검증 및 T4 배포 준비
-
3i4k 모델 검증 및 VTS 테스트셋 평가 전략
-
ReturnZero 모델 레지스트리 구조화 및 업무 현황 (Day 1633)
-
2025-05-01 일기: 건강 관리, 가족 건강, 기술 문제 해결
-
데이터 전략 논의 (Day 845)
-
3i4k 모델 성능 저하 분석 및 Pronaia 클라이언트 개발 현황
-
03 환경 구축 및 모델 데이터 이전
-
2025 년 5 월 2 일 일기: 하드웨어 문제 및 가족 건강
-
2021-01-18 일기: 워쉽, 독서, 젯슨 나노 문제
-
MWW 한국어 SIMS 및 팀벨 인프라 구축 현황
-
Day 966. 2024-02-22
-
팀벨 개발 환경 설정 및 SIMS 배포 준비 (Day 959)
-
2023-08-22 작업 일지: 일본어 데이터 전처리 및 Pronaia 테스트 환경 구축
-
2023-07-05 작업 계획 및 MWW 연동 이슈 해결
-
Day 699: dadumi 배포 및 일본어 ASR 평가
-
2023-03-23 작업 기록: 일본어 ITN 및 Qoo10 ASR 정렬
-
Day 285. 2022-04-11
-
SommersV4 Transcribe 파이프라인 분석 및 DevOps 이슈
-
Kaldi GoP 파이프라인 분석 및 Decodable 인터페이스 혼선
-
Kaldi Feature Pipeline 및 iVector 추출 탐색 (Day 272)
-
Day 254. 2022-03-11
-
Day 212. 2022-01-28
-
배치 구조 분석
-
Triton-Kaldi 디코딩 아키텍처 분석 및 iVector 적응 개념 탐구
-
오프라인 디코딩 아키텍처 비교
-
2026-04-09 업무: PVI, 일본어 ASR 개선 및 TTS 관리 기능 개발
-
Primary Voice Isolation(PVI) 평가 환경 구축 및 신한 SDK 16kHz 대응
-
2026-03-25 업무 및 기술 이슈 요약
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
Engine 코드 수정 및 검증 (2024-12-27)
-
2024-11-04 업무 및 기술 이슈 요약
-
RTZR-STT 서비스 Istio 네트워크 정책 및 장애 조치 실험 (2024-10-30)
-
MWW EKS 인프라 설정 및 API 테스트 기록
-
2024-07-21: ONNX 배포 실패 및 반기 회고
-
ReturnZero 빌드 및 환경 설정
-
k3s 노드 마이그레이션 및 하드웨어 교체
-
옵션 고민
-
2017-06-13: boomerang.js 분석 및 분산 처리 미들웨어 구상
-
Hypernetwork 구조 분석 및 한계점
-
Kiwi 형태소 분석기 모델 학습 및 N-gram 언어모델 이론 정리
-
2026-02-02 업무: 일본어 ASR 모델 개선 및 제로원 데이터 처리
-
현대캐피탈 Numberplate 모델 장애 진단 및 일본어 T4 모델 준비
-
Storage 문제 및 운영 환경 구축
-
2024-09-24 업무 진행 사항: 주소 모델 배포 및 시스템 테스트
-
2025-02-16 일기: 일상 기록 및 기술적 문제
-
현대캐피탈 차량번호 인식 모델 고도화 및 데이터 필터링
-
2025-12-05 일기: 빙판길 운전 경험 및 모델 변경 메모
-
주소 모델 개발 현황
-
리팩토링 시도: cdrewrite 및 transducer 기반 태그 삽입 성능 문제
-
Pronaia Online 서비스 운영 및 리소스 모니터링
-
일본어 개발계 배포 준비 및 장애 대응
-
일본어 데이터셋 평가 및 온프레미스 환경 설정
-
Day 750: Helm Chart, Pronaia Proxy Logic, and Docker Build Tasks
-
제한 테스트
-
주소 교정 (Address Correction)
-
일본어 TTS 기반 학습 및 주소 전사 실험 노트
-
Neural-ITN TensorRT 배포 시도 및 한계
-
CD 및 Transcriber 최적화 진행 상황
-
2022-11-21 작업 기록: 한글 교정 로직 수정 및 Highlighter PoC 환경 설정
-
신한은행 인프라 연동 및 라벨링 파이프라인 논의
-
Day 306: GoP Decoder 문서화 및 Triton Backend 연구
-
gop-kaldi 디코더 구조 분석 및 스트림 전송 설계
-
GOP Online Decoder 테스트 및 디버깅 (Day 286)
-
Day 238. 2022-02-23
-
Triton-Kaldi 보고 및 CER 준비 (Day 236)
-
Primary Voice Isolation(PVI) 및 일본어 ASR 개선 현황
-
Primary Voice Isolation(PVI) 및 신한은행 다국어 ASR 대응 현황
-
S2 리빌드 및 스택빌더 개발 현황 (2026-02-28)
-
TTS 개선 및 S2 리빌드
-
Whisper 차트 개선 및 배포 자동화
-
Pronaia Multilang 배포 디버깅 및 utterance_save 암호화 구현
-
ReturnZero STT 오프라인 설치 및 Kubespray 자동화 프로세스
-
2024-08-05 업무 및 인프라 설정 기록
-
알고리즘 메모
-
2025-03-29 일기: 기술적 좌절과 건강 관리
-
하아
-
Ray RLlib PPO 트레이딩 환경 초기화 오류 (Gymnasium API 호환성)
-
쿠폰 API 호환성 문제 및 ECS 알림 통합 작업