이 노트는 2022 년 11 월 21 일의 작업 일지를 기록한 것이다. 주요 내용은 네이버 검사 결과 기반의 띄어쓰기 추출 로직 구현 및 hanspell 수정, 복합 교정에서의 조사 관련 띄어쓰기 규칙 적용 (붙임/띄움) 이다. 또한 Kiwi space 관련 LM 학습의 C++ 커스터마이징 가능성을 검토했다. 마지막으로 Highlighter PoC 프로젝트에서 발생한 Node.js 파일 감시 제한 (ENOSPC) 오류를 CHOKIDAR_USEPOLLING=1 환경 변수 설정과 stderr 리다이렉트를 통해 우회 해결한 과정을 기술하고 있다.
-
맞춤법 봇: 띄어쓰기 교정 로직 및 API 테스트
-
맞춤법 검사 자동화 봇 및 데이터 파싱 로직
-
팀벨 (2024-03-28)
-
Day 588: 띄어쓰기 교정 실험 및 KAIST 채용 심사 기록
-
일본어 데이터 전처리 및 정제 규칙 (Day 790)
-
2024-05-17 업무 기록: 키워드 부스트 모델 배포 및 개발 환경 설정
-
2024-11-28 업무 및 실험 기록
-
rt-highlighter 배포 및 프로젝트 진행 상황 (Day 502)
-
2024-04-17 일기: RL 학습 및 시스템 최적화 노트
-
2022-07-11 일일 작업 기록: Pynini 트랜스듀서 디버깅 및 MariaDB 환경 설정
-
SIMS 모델 배포 및 게이트웨이 설정 작업
-
2023-08-22 작업 일지: 일본어 데이터 전처리 및 Pronaia 테스트 환경 구축
-
2023-08-08 작업 일지: 일본어 학습, MWW 배포, Dadumi
-
2024-08-05 업무 및 인프라 설정 기록
-
RBAC 설정 작업 기록
-
두나무 인프라 구축 및 환경 설정 작업 (Day 1329)
-
SIMS 환경 설정 및 최적화 (Day 1202)
-
ReturnZero 일본어 배포 및 문서 수정 (Day 1545)
-
2023-07-05 작업 계획 및 MWW 연동 이슈 해결
-
ReturnZero 빌드 및 환경 설정
-
Day 964: SIMS Helm 차트 수정 및 인프라 설정 작업
-
Kubespray 오프라인 환경 설정 및 NFS 프로비저너 배포 작업
-
2025-09-16 일본어 모델 배포 및 설정 작업
-
Day 425: 환경 설정 문제 및 하이라이터 프로젝트 방향성
-
현대캐피탈 고도화: SIMS 배포 및 환경 설정 (Day 1465)
-
팀벨 개발 환경 설정 및 SIMS 배포 준비 (Day 959)
-
Szurubooru 배포 및 설정 메모
-
팀벨(Timbel) 평가(Eval) 시스템 디버깅 및 인프라 설정
-
일본어 데이터셋 평가 및 온프레미스 환경 설정
-
제한 테스트
-
Day 957: 주소모델 실험 및 Kubernetes GPU 환경 설정
-
팀벨(Timbel) 개발 환경 구축 및 라이선스 발급 기록
-
BMT 모델 테스트 및 인프라 설정 (2024-01-05)
-
SIMS 0.4.0 배포 시험 및 설정 검토
-
MetalLB 및 Kubernetes 인프라 설정
-
Sandbox BMT 테스트 환경 구성 및 설정
-
SIMS 고도화 및 K8s 환경 구축 작업 기록 (Day 1492)
-
Pronaia STT 환경 설정 및 특허 미팅 기록 (Day 917)
-
SIMS 개발계 배포 및 Envoy gRPC 로드밸런싱 설정
-
2024-05-29 업무 및 기술 작업 기록
-
MWW EKS 인프라 설정 및 API 테스트 기록
-
AWS CLI 환경 설정 및 Triton Server 배포 준비
-
팀벨 프로젝트: 개인정보 필터링 및 서버 구축 작업
-
MWW EKS 환경 접속 및 배포 준비 (Day 1153)
-
dadumi 버그 수정 및 Pronaia API 구조 분석
-
2023-07-31 일일 작업 기록 및 장애 대응
-
2023-07-27 작업 계획: 일본어 모델 배포 및 Triton 설정
-
NFS 서버 및 autofs 클라이언트 설정
-
Day 750: Helm Chart, Pronaia Proxy Logic, and Docker Build Tasks
-
mww 운영계 배포 아키텍처 및 구성 요소
-
Engine 코드 수정 및 검증 (2024-12-27)
-
Triton 이미지 교체 및 Pronaia Engine 배포 작업
-
Pronaia Online 서비스 운영 및 리소스 모니터링
-
MWW 한국어 SIMS 및 팀벨 인프라 구축 현황
-
License Proxy 기술 검토
-
2026-03-19 일지: k3s 및 Stamcord 작업
-
PRONAIA BMT 서비스 배포 및 테스트 데이터 준비 현황
-
Pronaia Engine Keyword Boosting 모델 전사 테스트 및 배포 준비
-
프로나이아 모델 배포 및 스마트 어터런스 처리 로직 설계
-
신한카드 개발 환경 구축 및 문제점 (Day 1198)
-
K8s 이슈)
-
2024-11-27 작업 기록: 일본어 BMT 실험 및 Pronaia 서버 리팩토링
-
2024-12-03 작업 일지: 시스템 튜닝 및 배포
-
팩맨TF 및 dadumi-worker 아키텍처 리팩토링 고려사항
-
Envoy 로드밸런싱 문제 해결
-
Python Client 초기 배포 및 구조 검토 (Day 358)
-
프로나이아(Pronaia) 전사 요약 기능 개발 및 Kubespray 정리
-
MWW 한국어 SIMS 평가 및 커넥션 릭 재현 테스트
-
프로나이아 엔진 아키텍처 및 운영 이슈 (Day 715)
-
PII 영향 분석)
-
MWW 한국어 STT 배포 및 SIMS Backend 아키텍처 검토
-
테스트 진행 상황 (Day 965)
-
STT 실시간 엔진 배포 가이드 및 데이터셋 전처리 현황
-
Istio iptables 초기화 오류 해결 및 BMT 테스트 실행
-
AncomCluster 인프라 구성 및 서비스 배포 가이드
-
fp16 테스트 실패 및 배포 작업 기록
-
SIMS 헬름 구성 및 파이프라인 자동화 고민
-
MWW-TMN 배포 및 인프라 문제 해결 (2025-10-21)
-
Day 942: vito-worker 배포 및 STT 파이프라인 설정
-
프로나이아(Pronaia) 일본 배포 및 API 접근 제어 아키텍처 논의
-
Day 372 (2022-07-07) 작업 기록
-
Pronaia Engine 필터링 및 아키텍처 도식화 (Day 1044)
-
ReturnZero STT 서비스 K8s 배포 및 Triton Server 연동 작업 (Day 748)
-
MWW VAD 임계값 수정 및 테스트
-
Day 657: Vito Worker 배포 및 rt-neural-itn Torch 의존성 제거
-
Day 1042 작업 기록: 데이터셋, MWW 버그, 인프라
-
BLS 구현 및 배포 준비 (Day 694)
-
Day 727: vitoworker 테스트 복구 및 PoC 준비
-
한국어 배포 준비
-
Day 555: ONNX 모델 배포 및 환경 구성 고민
-
MWW 한국어 개발계 배포 및 기술적 장애 대응 (2023-11-15)
-
2022-05-18 일일 작업 기록: 서베이 및 배포 프로세스 개선 논의
-
BMT 엔진 벤치마크 오류 및 Helm 템플릿 수정
-
보고서 수정 및 재구성 작업 목록
-
Day 847: Triton 테스트 환경 구축 및 특허 전략 논의
-
한국어 모델 업데이트 및 ITN 테스트 환경 준비
-
gip-decoder 배포 및 TTS 아키텍처 검토
-
ReturnZero Day 1134: 에어갭 환경 구축 및 MWW 오류 대응
-
MWW 배포 및 ASR 파이프라인 디버깅 (2024-03-12)
-
프로나이아 패키지화 및 3i4k FP 검증
-
MWW 일본어 배포 및 가독성 평가 실험 (2024-07-24)
-
Sims 설치 패키지 및 인프라 구성 정리 (Day 1185)
-
스케줄링 이슈
-
MWW PoC 환경 구축 및 일본 PoC 진행 현황
-
MWW EKS 배포 장애 및 STT 모델 평가 이슈 (Day 1168)
-
STT-LLM-TTS 챗봇 기술 스택 및 설정 초안
-
배포 워크플로우 논의 (Day 859)
-
Triton 서비스 확장 및 Helm Chart 문제
-
Greedy Confidence 및 Entropy 기반 신뢰도 추론 아키텍처
-
ReturnZero Day 582: 워크플로우 연동 및 Triton 배포 계획
-
Day 323. 2022-05-19
-
KISA STT 솔루션 설치 및 환경 구성 (Day 1573)
-
팩맨 프로젝트 인프라 및 배치 작업 현황 (Day 1316)
-
Vito STT 성능 벤치마킹 및 환경 설정 기록 (2024-07-01)
-
ReturnZero Day 79: 인프라 설정 복구 시도 및 일감 데이터 쿼리
-
Day 966. 2024-02-22
-
Whisper 차트 개선 및 배포 자동화
-
Day 490. 2022-11-02
-
현대캐피탈 고도화: 취약점 패치 및 다중 모델 평가 환경 구축
-
일본어 데이터셋 전환 및 Quota 서비스 로직 수정
-
Pronaia Multilang 배포 디버깅 및 utterance_save 암호화 구현
-
대방 방문 작업 목록 및 기술적 이슈 (2023-08-16)
-
qoo10 일본어 서버 재가동 및 헬름차트 설정
-
E2E ASR 모델 Triton 서빙 환경 구축 및 테스트 (Day 723)
-
현대캐피탈 차량번호 인식 모델 파인튜닝 및 SIMS 일본어 환경 구축
-
Primary Voice Isolation(PVI) 평가 환경 구축 및 신한 SDK 16kHz 대응
-
Day 6. 2021-07-06
-
워커 3단 배포 전략 및 차트 개발 현황
-
llm-cli-gateway MCP 및 Async Skill 전역 설정 가이드
-
2025-08-20 업무: 현대캐피탈 고도화, 암호화 구현, Next Model 환경 구축
-
MWW EKS 배포 장애 및 RT-Annotation 문서화 개선
-
ReturnZero Day 1622: STT 파이프라인 개선 및 배포 인프라 작업
-
ITN 배포용 메트릭 설정 및 K8s 테스트베드 구축
-
NLP 팀 회의 및 다음 작업 아이템 (2022-05-12)
-
미래에셋 방문 및 일본어 데이터 준비 작업
-
ReturnZero Day 1749: PVI 및 일본어 ASR 개선 작업
-
두나무 EPD 최적화 및 농협은행 PoC 인프라 설정
-
MWW 배포 회고 및 테스트 데이터셋 구성 전략
-
Homura-Dan 라이센스 서버 아키텍처 및 RTFx 성능 벤치마크
-
Day 331. 2022-05-27
-
Day 300: 도커 배포, ivector 디버깅, gRPC 타임아웃 이슈
-
ReturnZero Day 1139: 개발 환경 구축 및 시스템 장애 대응
-
ReturnZero Day 1748: PVI 및 일본어 ASR 개선 작업
-
신한카드 프로젝트: MySQL 저장소 이전 및 모니터링 설정
-
인프라 환경 재정비 및 NAS 스토리지 구성
-
일본어 데이터 전사 비교 및 정규화 로직 수정
-
Day 852: 현대캐피탈 방문 및 use_vad_event 배포 준비
-
주소 교정 (Address Correction)
-
RTZR-STT 서비스 Istio 네트워크 정책 및 장애 조치 실험 (2024-10-30)
-
배포 테스트 (2024-09-11)
-
NovelAI 무료 사용법 및 프롬프트 가이드
-
S2 리빌드 문서화 및 다국어 RTFx 측정 환경 구축
-
2024-11-29 업무 기록: 일본어 모델 개선 및 PII 버그 수정
-
두나무 프로젝트 EKS 환경 구축 및 패킹 스크립트 점검
-
CD 및 Transcriber 최적화 진행 상황
-
릴단 파드 및 Triton Server 배치 구성 (Helm Values)
-
ReturnZero STT 오프라인 설치 및 Kubespray 자동화 프로세스
-
RTZR STT 서비스 K8s 네트워킹 문제 해결
-
Day 1043: PII Redaction Filter 개발 및 On-Prem 모델 관리
-
Torch 의존성 제거 및 Triton 이미지 배포 작업 (Day 658)
-
Prometheus 모니터링 이슈
-
2023-03-04 작업 진행 사항 (NLP4STT, 일본어 데이터셋, rt-dadumi)
-
일본어 ASR 파인튜닝 준비 및 코드 수정
-
2026-02-03 업무: 일본어 ASR 모델 개선 및 Triton 배포 환경 최적화
-
Day 491: E2E 음성 인식 서버 배포 장애 및 Kaldi 대체안 검토
-
MLOps 인프라 및 데이터 과학 공정 현황 (Day 251)
-
팩맨 프로젝트: 환경별 배포 전략 및 설치 표준화
-
Gemma2 기술 검토
-
Day 553: 띄어쓰기 벤치마크 설계 및 Pronaia Engine 아키텍처 분석
-
글로벌과제 회의: 실시간 연동 및 기술 이슈 논의
-
utterance_save 암호화 구현 및 SIMS 파이프라인 수정
-
일본어 STT 모델 벤치마킹 및 인프라 작업 기록 (2025-01-14)
-
03 환경 구축 및 모델 데이터 이전
-
Docker-in-Docker (DinD) 환경 설정 및 패턴 이스케이프 이슈
-
Triton 배포 및 모델 컴파일 파이프라인 정리 (Day 576)
-
ReturnZero Day 1623: STT 파이프라인 개선 및 인프라 자동화
-
Sims 프로젝트 기술 이슈 및 인프라 조정 (2025-03-12)
-
VITOSpeech Engine 동시접속 제한 및 현대캐피탈 PoC 준비
-
일본어 STT 이슈
-
2025-04-30 업무: 두나무 장애 및 농협 PoC 진행
-
다듬이 (2023-07-06)
-
Day 301. 2022-04-27
-
모델 서빙 아키텍처 논의
-
2025-08-11 업무: 현대캐피탈 고도화, utterance_save 암호화, Next Model, 신한카드
-
프로나이아 프로젝트 및 인프라 운영 일지 (Day 1287)
-
dadumi lang 포함
-
음성 데이터 전사 및 변환 작업 현황 (2024-05-22)
-
WSL 환경 구축 및 AI 개발 스택 설정
-
Dadumi 배포 및 샌드박스 테스트 진행 상황 (Day 695)
-
Neural-ITN TensorRT 배포 시도 및 한계
-
ReturnZero Day 1743: PVI, 일본어 ASR 개선 및 신한 SDK 빌드
-
2024-11-04 업무 및 기술 이슈 요약
-
2024-07-21: ONNX 배포 실패 및 반기 회고
-
STAMCord 리팩토링 로드맵 및 기술 메모
-
신한카드 K8s 방화벽 설정 및 모델 파이프라인 개선 고민
-
MWW EKS Bastion 접속 및 GitLab 설정 장애 대응
-
2025-01-09 일일 작업 기록 및 두나무 프로젝트 킥오프
-
Day 950: PTQ 세미나 및 작업 진행 상황
-
LLM 엔지니어링 및 한국어 모델 학습 환경 구축 참고 자료
-
Pronaia-Engine 코드 폴리싱 및 Triton Mel 성능 검증
-
Day 902: Audio Feature Extraction & Model Check
-
일본어 개발계 배포 준비 및 장애 대응
-
Day 851: 팀벨 미팅 및 현대캐피탈 운영 이슈
-
Triton Server 헬름 차트 배포 및 모델 로딩 오류
-
ITN 모델 배포 및 성능 튜닝 (Day 666)
-
ReturnZero Day 1745: PVI, 일본어 ASR 개선 및 Kubernetes 보안 검토
-
2025-08-29 업무: 현대캐피탈 고도화 및 일본어 SIMS 배포 준비
-
ReturnZero Day 1061: STT 엔지니어링 및 평가 현황
-
ReturnZero Day 860: STT 모델 수정 및 성능 벤치마크
-
ReturnZero Day 291: gRPC 로직 및 Ali-phone 정렬 디버깅
-
공유기 네트워크 설정 및 NTP 문제 해결 참고 링크
-
일본어 ASR 파이프라인 설정 및 실험 기록
-
일본어 NLP 파이프라인 및 데이터셋 전처리 작업 기록
-
2023-08-28 일일 작업 기록: 일본어 데이터 분석, 현대캐피탈 장애 대응, GPU Operator 설치
-
Day 665: ITN 모델 배포 장애 및 환경 정리
-
다듬이 마무리 (Day 702)
-
Triton Inference Server 앙상블 배치 처리 검증
-
ASR 모델 개선 현황: PVI, 일본어, MWW 화물맨
-
ReturnZero Day 1756: PVI 및 일본어 ASR 개선 이슈
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-13)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-06)
-
2026-02-26 업무 일지: 일본어 ASR 개선 및 S2 리빌드
-
ReturnZero Day 1625: 웰컴용 Translator 패키징 및 일본어 모델 개선
-
삼성 SW 검정 프로페셔널 준비 및 재원 형과의 대화
-
Day 1132: Airgap 환경 구축 및 GPU Operator 배포 시도
-
2025-05-21 업무: 두나무 Sentry, SIMS 감사, IBK 배포, 인텔 PoC 결과
-
2023-02-24 작업 기록: 일본어 STT 조사 및 통합 ITN 설계
-
두나무 프로젝트: 라이선스 서버 및 EKS 인프라 설정
-
GoModel API 연동 설정 및 사용법
-
일본어 TMN 회의 및 팀벨 클러스터 작업
-
두나무 프로젝트 진행 상황 및 인프라 설정 (2025-03-28)
-
2025-04-03 업무 진행 사항 (두나무, 농협은행 PoC, Dan 인수, Builder)
-
BERT 모델의 ONNX 변환 및 Triton Server 배포 시도 (Day 559)
-
ReturnZero Day 1762: PVI 및 일본어 ASR 개선 현황
-
2026-04-22 업무: PVI, 일본어 ASR 개선 및 Silero VAD 평가
-
2026-04-09 업무: PVI, 일본어 ASR 개선 및 TTS 관리 기능 개발
-
신한카드 프로젝트: 온프레미스 인프라 및 SRE 운영 현황
-
신한카드 개발계 설치 및 매뉴얼 업데이트
-
Kubernetes 클러스터 보안 점검 및 Day 1199 업무 기록
-
Day 1105. 2024-07-10
-
Storage 문제 및 운영 환경 구축
-
ReturnZero Day 1058: ASR 파이프라인 진행 상황 및 버그 수정
-
2023-09-07 작업 기록: 일본어 ASR 모델 학습 및 MWW 업무
-
GPU 오퍼레이터 설치 및 Air-gapped 환경 구축 준비
-
두나무 시스템 모니터링 및 IBK PoC 이슈
-
Day 904: STT 학습 기능 논의 및 배포 준비 (2023-12-21)
-
일본어 이름 모델 검증 및 T4 배포 준비
-
Qoo10 데이터 정규화 및 장애 대응 기록
-
pysommers 개발 진행 상황 및 반성 (2023-01-03)
-
ReturnZero Day 1785: PVI, 일본어 ASR 개선 및 MWW 배포
-
ReturnZero Day 1765: PVI 및 일본어 ASR 모델 개선 현황
-
Primary Voice Isolation(PVI) 및 일본어 ASR 개선 현황
-
Primary Voice Isolation 및 일본어 ASR 개선 현황 (2026-03-31)
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-16)
-
2026-01-22 업무 및 모델 개선 이슈
-
ReturnZero Day 1343: 차트 리팩토링 및 온프렘 설치 스크립트 점검
-
Steam 병행 실행)
-
두나무 과거 데이터 전사 작업 중 용량 및 SSO 이슈
-
Kiwi NLP 모델 빌딩 및 데이터 전처리 작업 기록
-
다듬이: 음성 텍스트 전처리 로직 개선
-
CentOS 7 기반 NVIDIA GPU 환경 구축 및 모델 배포 준비
-
Day 901. 2023-12-18
-
띄어쓰기 모델 변환 및 성능 테스트
-
PVI 및 일본어 ASR 모델 개선 현황 (2026-05-22)
-
2026-05-21 업무: PVI 및 일본어 ASR 모델 개선 현황
-
2026-05-15 업무: PVI, 일본어 ASR, MWW 배포 이슈
-
PVI 최적화 및 일본어 ASR 모델 개선 현황 (2026-05-06)
-
Primary Voice Isolation(PVI) 및 신한은행 다국어 ASR 대응 현황
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 계획
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-19)
-
TTS 개선 및 S2 리빌드
-
2026-01-27 업무: 제로원 TTS, 일본어 ASR 개선, 두나무 유지보수
-
ReturnZero Day 1500: 현대캐피탈 고도화 및 utterance_save 암호화 구현
-
현대캐피탈 고도화 및 utterance_save 암호화 구현 현황 (2025-08-05)
-
현대캐피탈 고도화 및 utterance 암호화 구현 현황
-
농협카드 Docker 전환 검토 및 현대캐피탈 음성인식 고도화
-
Pronaia-engine 법무 검토 요청 및 Pacman 오픈소스 정리
-
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
-
오픈소스 라이브러리 운영 및 글로벌화 전략
-
2025-03-20 업무 기록: 개인정보 시스템 법적 검토 및 라이선스 서버 로직
-
Day 89: 데드락 해결 및 수지바오 로직 수정
-
Kaldi ASR 모델 테스트 환경 설정 및 초기 실행 문제
-
일본어 숫자 및 날짜 처리 로직 개선 (Day 533)
-
폐쇄망(Air-gapped) Kubernetes 환경 구축 및 도구 평가
-
Traefik)
-
2025-08-12 업무 진행 상황: 현대캐피탈, utterance 암호화, Next Model, 신한카드, 쿠팡 PoC
-
일본어 Neural ITN 및 4090 환경 빌드 시도
-
pysommers 데이터셋 전사 및 파일 매핑 작업 (2024-04-17)
-
Day 937: 다드미 버그 수정, 일본어 데이터 수집, 특허 보완
-
주소 인식 모델 성능 검증 및 Triton 배포 전략
-
MWW K8s Batch Cronjob 해제 및 현대캐피탈 방문 준비
-
ReturnZero Day 359: Python Client 완료 및 3i4k 데이터 FP 검증 시작
-
ReturnZero Day 1736: PVI 및 일본어 ASR 개선 현황
-
Primary Voice Isolation 및 일본어 ASR 개선 과제
-
TTS 모델 개선 및 S2 리빌드
-
ITN 개선 및 제로원 착수 준비
-
ReturnZero Day 1645: 모델 레지스트리 및 웰컴용 STT 패키징 진행
-
2025-09-23 업무: 일본어 배포 및 서울소방 로그 분석
-
현대캐피탈 Numberplate 모델 장애 진단 및 일본어 T4 모델 준비
-
2025-09-02 업무: 일본어 T4, 현대캐피탈 고도화, utterance 암호화
-
현대캐피탈 고도화 및 일본어 모델 개발 진행 상황 (Day 1524)
-
현대캐피탈 고도화 이슈 대응 및 utterance_save 암호화 구현
-
현대캐피탈 고도화: SIMS 설치 및 인프라 구성 이슈
-
2024-09-19 업무: 일본어 STT 모델 튜닝 및 Prefix Decoder 디버깅
-
Day 1143: 업무 및 기술적 문제 해결 기록
-
Day 1104 (2024-07-09) - ReturnZero Daily Note
-
Nextcloud Kubernetes Ingress 설정
-
발표 스킬 및 연구 이슈 정리 (2019.12.17)
-
Rocky Linux 환경 Docker 및 Triton Server 이미지 설정
-
Envoy 로드밸런싱 아키텍처 재고 및 GPU 운영 환경 정리
-
일어 음성 처리 파이프라인 디버깅 및 ITN 수정
-
2022-12-13 작업 기록: NLP 파이프라인 디버깅 및 일본어 ITN 통합
-
Day 1015: 음성 전처리 교정 및 LLM 임베딩 학습
-
2024-04-08 일일 작업 기록: 둠피 전사 오류 및 인프라 복구
-
2025-09-12 업무 우선순위: 일본어 배치 및 GPT 작업
-
긴 입력 처리 아키텍처 검토 (Day 586)
-
Day 58 (2021-08-27): 벨 프로젝트 인수 및 EFS 장애 대응
-
2022-12-26 회사 근황 및 NLP 기술 검토
-
Day 536. 2022-12-18
-
신한은행 인프라 연동 및 라벨링 파이프라인 논의
-
TTS 후순위 전환 및 ASR 집중 전략 수립 (2022-05-23)
-
Triton Custom Backend 학습 계획 및 모델 웜업 개념 정리
-
PVI 모델 개선 및 일본어 ASR 이슈 분석
-
화물맨 ASR 도메인 특화 및 일본어 모델 개선 현황
-
2026-04-23 업무: PVI 및 일본어 ASR 개선
-
Primary Voice Isolation(PVI) 및 신한은행 다국어 STT 대응 현황
-
2026-03-09 업무 및 S2 리빌드 현황
-
2026-02-08 업무: 일본어 ASR 모델 개선 및 웰컴 프로젝트 인프라 구축
-
2026-01-26 업무: 제로원 준비 및 일본어 ASR 개선
-
2026-01-23 업무: 제로원 집중 및 일본어 STT 개선
-
2026-01-20 업무: 제로원 TTS 데이터 정제 및 일본어 STT 모델 배포 가이드
-
ReturnZero Day 1644: 모델 레지스트리 구축 및 웰컴용 STT 패키징
-
ReturnZero 모델 레지스트리 구조화 및 업무 현황 (Day 1633)
-
RTZR 일본어 ASR 개발 이력 및 모델 레지스트리 구조
-
차트 개편
-
Pacman 차트 개편 및 현대캐피탈 VAD 이슈 대응
-
차트 개선 및 두나무 EKS 접속 이슈
-
2025-10-16 업무: 일본어 STT 실험 및 KISA 프로젝트 준비
-
2025-09-08 업무: 일본어 SIMS 배포 및 현대캐피탈 고도화 준비
-
SIMS 일본어 설치 및 현대캐피탈 모델 고도화 진행 상황
-
현대캐피탈 고도화 및 utterance_save 암호화 구현 현황 (2025-08-06)
-
현대캐피탈 고도화 운영 준비 및 SIMS 암호화 구현 현황
-
처리 워크플로우
-
ReturnZero Day 1442: Pacman 배포 전략 및 신한카드 개발계 오류
-
두나무)
-
VITO 요약 회의 및 RoBERTa 의도 분석 모델 논의
-
현대캐피탈 OS 변경 대응: STT 및 라이선스 서버 디렉토리 이관 목록
-
SUJ-298 메일 발송 인프라 구축 및 도메인 설정 문제
-
2023-03-23 작업 기록: 일본어 ITN 및 Qoo10 ASR 정렬
-
Stable Diffusion 파인튜닝 및 LLM 환경 구축 기록
-
일본어 NLP 화이트리스트 및 배포 기록
-
ITN Triton 통합 배포 및 스레드 풀 문제
-
T4 빌드 및 일본어 NLP 처리 방안
-
다듬이 및 일본어 모델 처리 논의 (Day 642)
-
아서의 튜토리얼 - bmt 사용법
-
ReturnZero Day 1794: PVI 및 일본어 ASR 개선 현황
-
Primary Voice Isolation (PVI) 파이프라인 개선 및 일본어 ASR 모델 이슈
-
S2 리빌드 문서화 및 RTZR STT 솔루션 아키텍처 정리
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-04)
-
2026-01-21 업무: 제로원 TTS 데이터 정제 실패 및 일본어 STT 모델 개선 계획
-
2026-01-15 업무 및 일본어 ASR 개선 계획
-
ReturnZero Day 1650: 업무 현황 및 제로원 TTS TN 설계 초안
-
TTS 인프라 개선 및 웰컴저축은행 프로젝트 킥오프
-
MWW 사업 리뷰 및 오뚜기 음성 인식 이슈 대응
-
일본어 음성 인식 파인튜닝: 문자셋 재정의 및 데이터 혼합 비율 조정
-
현대캐피탈 고도화 및 utterance_save 암호화 구현 현황 (2025-08-04)
-
현대캐피탈 고도화: 반입 준비, 취약점 스캔, utterance 암호화 구현
-
Day 1380. 2025-04-10 - 업무
-
2025-02-06 업무 및 기술 검토 (팩맨, 두나무, MWW)
-
신한카드 프로젝트: GPU 모니터링 및 화자분리 파이프라인 구축 검토
-
Day 1036: 상태 확인 및 기술적 장애물
-
Triton 서버 구축 및 pysommers 데이터 전처리
-
Day 1022 (2024-04-18) - ReturnZero Daily Note
-
기가코리아 개발 회의
-
Stock Trader 데이터 준비 및 아키텍처 검토
-
RLLib 얼라인: 학습 코드 검토 및 Google Trends 데이터 검증
-
polyglot-ko 서빙 준비도
-
2025-06-10 업무 기록: SIMS 빌드 환경, Pacman 모델 평가, 신한카드 컨테이너 오류
-
2025-07-09 업무: RAPA 발표자료 및 프로젝트 수정
-
ITN 수정 및 토크나이징 성능 최적화 고민
-
ITN 모델 최적화 및 데이터 전처리 작업 기록
-
Triton Server 기반 Kaldi ASR 배포 시도 및 환경 문제
-
두나무 프로젝트: SSO, AWS LB 설정 및 서비스 정책 검토
-
2024 Q1 OKR 초안: 신한은행 이관 및 포스코 데이터 테스트
-
Confidence 구현
-
Day 820. 2023-09-28
-
ASR 파싱 및 인프라 요구사항 (Day 791)
-
Day 693. 2023-05-24
-
일본어 ASR 얼라인 및 ITN 파이프라인 개발 (Day 635)
-
Day 610: 태스크 정리 (NLP4STT, 다듬이, 일본어 데이터)
-
ReturnZero E2E 파이프라인 실행 순서 및 데이터 구조 분석
-
Day 212. 2022-01-28
-
2026-05-28 업무 및 기술 이슈 요약
-
2026-05-14 업무 및 기술 이슈 요약
-
PVI 성능 최적화 및 일본어 ASR 모델 개선 현황
-
Primary Voice Isolation (PVI) 성능 평가 및 일본어 ASR 개선 계획
-
2026-03-25 업무 및 기술 이슈 요약
-
S2 리빌드 및 스택빌더(S2 Rebuild & StackBuilder) 개발 현황
-
S2 리빌드 및 스택빌더 개발 현황 (2026-02-28)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-02-27)
-
TTS 모델 개선 및 S2 리빌드
-
한국어 TTS 정규화 모델 개발 및 일본어 ASR 개선 현황
-
TTS 개선 및 S2 리빌드
-
TTS 모델 개선 및 제로원 준비
-
2026-01-14 업무 및 일본어 모델 배포 준비
-
제로원 프로젝트 진행 상황 및 기술적 이슈 (2026-01-12)
-
rtzr-stt Pacman 개선 및 VAD 필터 기술 검토
-
2025-09-26 현대캐피탈 현장 방문 및 STT 서비스 상태 확인
-
현대캐피탈 고도화 프로젝트: MWW 회의 및 인프라 설치 계획
-
2025-06-30 업무 진행 사항: RAPA 과제 리뷰 준비 및 현대캐피탈 SIMS 고도화
-
MWW SIMS 개발 현황
-
ReturnZero STT 서비스 운영 및 신한은행 다국어 프로젝트 준비
-
두나무 업무 및 차트 리팩토링 계획 (Day 1338)
-
PVC 구성 전략 (ReturnZero)
-
프프프 프로나이아 (On-Prem Kubernetes Dashboard & Worker Issue)
-
Istio 네트워크 문제 조사
-
gRPC Insecure 연결 문제 및 STT API 통합 문의
-
Parquet 오디오 데이터 추출 및 전처리 스크립트
-
RTBoost Dataset VAD 오류 및 전처리 파이프라인 수정
-
Day 63 (2021-09-01): Vito Admin 수정 및 배포 환경 문제
-
유튜브 자막 전사 데이터 손실 및 저장소 오류
-
PRONAIA 엔진 ITN 파이프라인 오류 (FstOpError)
-
Day 875. 2023-11-23
-
출장 정리 및 이름 모델 개선 계획 (2023-11-14)
-
Qoo10 일본어 ASR 파이프라인 및 엔진 성능 테스트 (Day 797)
-
새 일본어 고객 (Day 786)
-
주소 모델 개발 현황
-
Day 699: dadumi 배포 및 일본어 ASR 평가
-
2023-01-05 일지: pysommers 배포 문제 해결, NLP4STT 띄어쓰기 모델 최적화 및 사업계획
-
일본어 ITN 서비스 배포 및 테스트 진행 상황
-
Day 285. 2022-04-11
-
일본어 ASR 이슈 및 UBase 타운홀 요약
-
2026-01-19 업무: 제로원 TTS 데이터 파이프라인 및 일본어 ASR 모델 개선
-
2026-01-02 업무 및 제로원 TTS TN 프로젝트 킥오프
-
ReturnZero STT 솔루션 개발 및 모델 레지스트리 구조화
-
2025-12-10 업무: STT 패키징, VAD 필터링, 및 인프라 개편
-
일본어 데이터 전사 이슈 및 두나무 로깅 아키텍처
-
2025-08-25 업무: 현대캐피탈 TTS 장애, utterance 암호화, 일본어 모델 디버깅
-
2025-07-02 업무 진행 상황 (RAPA, 현대캐피탈, 두나무, 신협, 삼성전자)
-
Day 1314 (2025-02-03) - 업무 및 조직 개편
-
nerdctl 및 BuildKit 설정 가이드
-
2024-09-30 업무 일지: 신한카드 및 서울소방재난본부 프로젝트 진행 상황
-
일본어 주소 인식 모델 배포 및 MWW STT 성능 검증
-
Day 1125. 2024-07-30 - 업무
-
Day 1055: 전사 품질 필터링 및 Triton E2E 디코딩 오류 분석
-
홈서버 인프라 현황 및 개선 계획
-
어제를 사는 힘 (2025-11-18)
-
2017-06-26 일지: 이더리움 손절 및 distributed-workerpool 개발
-
Day 250: Rescore 구현 완료 및 Triton-Kaldi 환경 구축 삽질
-
ASR 방향성 회의 및 3i4k 환경 구축 삽질
-
두나무 데이터 전사: EKS CNI 및 Pod Security Group 설정 장애 분석
-
Day 995. 2024-03-22
-
dadumi
-
온프레미스 Triton 엔진 동시처리 검증 및 Envoy LB 구성
-
NLP 문제 정의
-
ITN 서비스 배포 및 VAD 통합 구성 검토
-
PVI 성능 개선 및 일본어 ASR 모델 이슈 분석
-
S2 리빌드 및 스택빌더 문서화 진행 상황
-
2026-01-30 업무: 일본어 ASR 개선, 제로원 데이터 처리, 두나무 인프라 이슈
-
2026-01-16 업무: 두나무 STT 연동 장애 및 일본어 모델 개선
-
2026-01-13 업무 및 기술 노트
-
RTZR-STT 모델 레지스트리 구조화 및 배포 자동화 계획
-
RTZR 일본어 STT 개발 이력 및 인프라 현황
-
rtzr-stt 파이프라인 개선 및 STT 인식 오류 분석 (2025-11-12)
-
rtzr-stt Pacman 개선 및 부산소방 이슈 대응 (2025-11-10)
-
일본어 데이터 정제 및 전처리 파이프라인 (Day 1562)
-
현대캐피탈 배포 및 제로원 프로젝트 킥오프
-
2025-08-22 업무: 현대캐피탈 고도화, 암호화 구현, Next Model 디버깅
-
2025-08-21 업무: 현대캐피탈 고도화, utterance 암호화, Next Model 배포
-
2025-07-15 업무: 현대캐피탈 고도화 및 rtzr-stt 운영 준비
-
두나무 프로젝트 업무 진행 상황 (2025-04-04)
-
2024-12-12 업무 및 신한카드 아이쏠라 배치 준비
-
일본어 STT 모델 튜닝 및 팀벨 서비스 장애 대응
-
일본어 ASR 모델 학습 및 데이터 전처리 진행 상황 (2024-07-15)
-
일본어 데이터셋 구축 및 전사 파이프라인 디버깅
-
폰 데이터 이전 및 정리 체크리스트
-
2018-05-08 ETRI 재섭 발표
-
개선일신 및 프로젝트 우선순위
-
ITN 파이프라인 통합 및 일본어 정규화 작업 현황 (Day 602)
-
일본어 음성 전사 파이프라인 설계 및 고려사항
-
Day 946: YouTube 데이터 파이프라인 실험 및 Worker 테스트 이슈
-
dadumi한테 어떻게 task를 줄건데
-
Day 8. 2021-07-08
-
일본어 철자전사 Align 및 신한은행 프로젝트 Kickoff
-
TED 일본어 데이터셋(테스트용)
-
현대 캐피탈 프로젝트 마무리 및 대용량 파일 처리
-
일본어 ASR 모델 디버깅 및 성능 비교 (Day 704)
-
리팩토링 시도: cdrewrite 및 transducer 기반 태그 삽입 성능 문제
-
프로젝트 Bled 중단 및 SAC 프로젝트 집중
-
Recall) 이해 및 HuggingFace Transformers 학습 코드 분석
-
Project-K 지역락 이슈 및 모델 이미지 재퍼블리시
-
ASR 모델 개선 및 프로젝트 진행 현황 (2026-05-07)
-
S2 리빌드 및 다국어 RTFx 측정 (2026-03-11)
-
S2 리빌드 및 스택빌더 이슈 해결
-
TTS 모델 개선 및 S2 리빌드 진행 상황
-
2026-02-02 업무: 일본어 ASR 모델 개선 및 제로원 데이터 처리
-
RTZR-STT 패키징 자동화 및 모델 레지스트리 설계
-
2025-11-21 업무: 두나무 인프라 장애, Pacman 차트 개선, MWW 대응