이 노트는 Kaldi 프레임워크를 사용하여 GoP(Goodness of Pronunciation) 시스템을 구현하기 위한 코드 리뷰 과정과 기술적 고민을 기록한 일기 형식의 메모입니다. 저자는 GMM 기반과 DNN 기반 GoP 구현체(jimbozhang, tbright17 등)를 비교 분석하며, compute-gop 및 compute-dnn-gop의 입력 인자(tree, model, lexicon, feature 등)와 처리 파이프라인(OnlineNnet2FeaturePipeline, MFCC 추출 등)을 추적했습니다. 특히 DNN 기반 구현의 컴파일 문제, LPP/LPR 벡터 계산 방식, 그리고 디코딩 과정과의 관계에 대한 의문점을 남겼으며, 향후 David와의 논의와 추가 코드 실험을 계획하고 있습니다.
-
GoP(Goodness of Pronunciation) 서비스 구현 및 NLP 태스크 검토
-
GOP(Kaldi) 구현 준비 및 GRPC 프로토콜 설계
-
Kaldi GoP 파이프라인 분석 및 Decodable 인터페이스 혼선
-
GoP 계산 파이프라인 분석 및 구현 계획 (Day 275)
-
GoP(Goodness of Pronunciation) 평가 파이프라인의 C++ 바이너리화 및 Feature Pipeline 문제
-
GoP 입력 파일 비교
-
GoP 발음 평가 및 NLP 과제 방향성 재정의
-
GoP 레시피 분석 및 CPU 온라인 디코더 아키텍처 검토
-
Kaldi OnlineNnet2FeaturePipeline 및 GOP 확률 추출 과정 분석
-
gRPC 서버 구현 및 iVector 추출 파이프라인 분석 (2022-04-07)
-
Kaldi Feature Pipeline 및 iVector 추출 탐색 (Day 272)
-
출력 파이프라인 정리 및 Protobuf 정의 시도
-
Triton-Kaldi 오프라인 디코더 구현 및 Triton 배치 처리 분석
-
GOP Online Decoder 테스트 및 디버깅 (Day 286)
-
GoP-Kaldi 파이프라인 구현 막힘: 어터런스 단위와 디코더 가정의 불일치
-
gop-kaldi 디코더 구조 분석 및 스트림 전송 설계
-
GOP 디코더 디버깅: iVector 차원 불일치 문제
-
Triton-Kaldi 통합 및 Kaldi 레시피 구조 분석 (Day 190)
-
gRPC 연동 및 GoP 디버깅 (Day 290)
-
Kaldi BigLM Rescoring 구현 및 하이퍼파라미터 튜닝
-
GOP 디코더 PoC 배포 및 검증 우선순위 재정의
-
GOP 디버깅: CMVN 적용 효과 검증 및 오해 해소
-
Triton-Kaldi 오프라인 디코더 아키텍처 설계 및 구현 계획
-
Triton-Kaldi 디코딩 파이프라인 분석 및 Sommers 후처리 장애
-
Triton-Kaldi 오프라인 전환 및 백엔드 구조 분석
-
안정성 문제 해결
-
Day 265: Vito-Kaldi 디코더 구조 분석 및 오프라인 디코딩 미완료
-
Day 282. 2022-04-08: GRPC 컴파일 시도 및 GoPRequest 파이프라인 설계
-
GOP 계산 오류 디버깅 및 gRPC 서버 테스트 (Day 292)
-
GOP 디코더 디버깅 및 배포 일정 (Day 296)
-
GOP 프로젝트: ivector 문제 탐색 및 도커 배포 준비 (Day 299)
-
2022-05-17: 세미나 발표 회고 및 GoP Decoder 문서화
-
Triton-Kaldi 디코딩 아키텍처 분석 및 iVector 적응 개념 탐구
-
SommersV4 Transcribe 파이프라인 분석 및 DevOps 이슈
-
배치 구조 분석
-
팀벨 문의 - 웹소켓-gRPC 연동
-
rt-tokenizer CLI 구현 및 백엔드 디토크나이징 파이프라인 적용
-
Triton Custom Backend 세미나 준비 및 GoP Decoder 정리
-
HifiGAN) 학습 현황
-
Triton-Kaldi 오프라인 디코딩 및 Sommers 데이터셋 연동 문제
-
Day 250: Rescore 구현 완료 및 Triton-Kaldi 환경 구축 삽질
-
Kaldi VAD 트리밍 입력의 컨텍스트 처리 및 소머즈 후처리
-
Triton-Kaldi GRPC 통신 분석 및 Sommers 모델 디버깅
-
Triton-Kaldi Offline Decoder 설계 및 HifiGAN 연구
-
Triton-Kaldi 백엔드 구조 학습 및 커스텀 백엔드 빌드 방법
-
Kaldi 메모리 오버플로우 및 WER 100% 성능 붕괴 원인 분석
-
오프라인 디코딩 아키텍처 비교
-
Day 205: 오프라인 디코더 비교 실험 및 화자분리 장애 대응
-
Day 306: GoP Decoder 문서화 및 Triton Backend 연구
-
Triton-Kaldi 컴파일 장애 및 RescoreLatticePostprocessor 심볼 오류
-
Triton-Kaldi Rescore Lattice Postprocessor 통합 및 빌드 이슈 해결
-
운영 이슈
-
Day 253: Vito-kaldi 리팩토링 및 Triton-kaldi 반영
-
Triton-Kaldi GRPC 연결 실패 및 클라이언트 호환성 문제
-
Triton-Kaldi Offline Decoder 리팩토링 및 TTS 학습 진행 상황 (Day 259)
-
Triton-Kaldi 보고 및 CER 준비 (Day 236)
-
Triton-Kaldi 컨테이너 버전 업그레이드 및 성능 관찰
-
일단 합쳤다가 풀기 (Batch Processing & Async Architecture)
-
Triton-Kaldi 통합 테스트 및 팅커벨 사전 기능 설계 (Day 231)
-
Triton Python Backend 예제 실행 및 구조 분석
-
Triton-Kaldi ASR 파이프라인 개선 및 스트레스 테스트 계획
-
Triton-Kaldi ASR 성능 벤치마킹 및 메모리 이슈 분석
-
Triton Kaldi 메모리 누수 및 성능 저하 문제 분석 (Day 229)
-
Triton-Kaldi 서버 성능 저하 및 GPU 메모리 이슈 분석
-
Day 203: Sommers Dataset Testing & Detokenization Issues
-
Kaldi ASR 모델 테스트 환경 설정 및 초기 실행 문제
-
Triton Server 기반 Kaldi ASR 배포 시도 및 환경 문제
-
Hypernetwork 구조 분석 및 한계점
-
Triton GPU OOM 문제 및 팀 전환 초기 적응
-
Triton Kaldi 서빙 시 메모리 누수 및 크래시 디버깅
-
Day 491: E2E 음성 인식 서버 배포 장애 및 Kaldi 대체안 검토
-
Day 238. 2022-02-23
-
Day 329. 2022-05-25
-
2017-06-13: boomerang.js 분석 및 분산 처리 미들웨어 구상
-
TensorTrade 2.0 적용 및 RL 에이전트 디버깅
-
Day 239. 2022-02-24
-
Day 247. 2022-03-04
-
Day 254. 2022-03-11
-
Rustdesk 연동 성공 및 Tailscale 활용
-
Day 264. 2022-03-21
-
Day 301. 2022-04-27
-
Day 315. 2022-05-11
-
Day 285. 2022-04-11
-
Day 300: 도커 배포, ivector 디버깅, gRPC 타임아웃 이슈
-
Triton Kaldi ASR 클라이언트 메모리 폭주 및 성능 저하 디버깅
-
Recall) 이해 및 HuggingFace Transformers 학습 코드 분석
-
Triton Inference Server 앙상블 배치 처리 검증
-
Confidence 구현
-
BLS 구현 및 배포 준비 (Day 694)
-
gRPC Insecure 연결 문제 및 STT API 통합 문의
-
Triton 서버 구축 및 pysommers 데이터 전처리
-
2025-08-22 업무: 현대캐피탈 고도화, 암호화 구현, Next Model 디버깅
-
ReturnZero Day 1489: utterance 암호화 구현 및 Next Model(일본어) 탐색
-
ReturnZero E2E 파이프라인 실행 순서 및 데이터 구조 분석
-
FST 기반 분류기 구조 및 코드 리팩토링 (Day 435)
-
BERT 모델의 ONNX 변환 및 Triton Server 배포 시도 (Day 559)
-
rt-itn-jp 코드 모델 및 WFST 구현 계획
-
pynini 학습 노트
-
Pronaia Multilang 배포 디버깅 및 utterance_save 암호화 구현
-
Triton Custom Backend 학습 계획 및 모델 웜업 개념 정리
-
Triton Ensemble 구현 및 NLP4STT 띄어쓰기 이슈
-
안드로이드 인증 구현 및 Keycloak 연동 고민
-
WFST 목록화 및 의존성 구문 분석 탐색
-
OVMS 컨테이너 Segmentation Fault (Exit Code 139)
-
리팩토링 시도: cdrewrite 및 transducer 기반 태그 삽입 성능 문제
-
Torch 의존성 제거 및 Triton 이미지 배포 작업 (Day 658)
-
gip-decoder 배포 및 TTS 아키텍처 검토
-
Vocab 실험 및 작업량 분석
-
2025-09-23 업무: 일본어 배포 및 서울소방 로그 분석
-
ReturnZero Day 1047: 일본어 ASR 모델 검증 및 성능 분석
-
Pronaia-Engine 코드 폴리싱 및 Triton Mel 성능 검증
-
dadumi 버그 수정 및 Pronaia API 구조 분석
-
TinyMCE S3 연동, 트랜스크라이버 코드 분석
-
Whisper 인프라 개선, 브라우저 DNN 탐색
-
MR 컴퓨팅 환경 고찰
-
Triton Server 헬름 차트 배포 및 모델 로딩 오류
-
NeuralITN TRT 변환 성공 및 Triton 포팅 과정
-
Day 555: ONNX 모델 배포 및 환경 구성 고민
-
utterance_save 암호화 구현 및 SIMS 파이프라인 수정
-
utterance_save 암호화 구현 및 sims-trainer 구조 개선
-
ReturnZero Day 532: Kiwi 모델 검증 및 일본어 숫자 태깅 규칙 분석
-
멀티뷰 학습 및 vLLM 서빙 엔진 탐색
-
Day 902: Audio Feature Extraction & Model Check
-
ITN 모델 배포 및 성능 튜닝 (Day 666)
-
Neural-ITN TensorRT 배포 시도 및 한계
-
ReturnZero Day 291: gRPC 로직 및 Ali-phone 정렬 디버깅
-
Engine 코드 수정 및 검증 (2024-12-27)
-
2025-08-20 업무: 현대캐피탈 고도화, 암호화 구현, Next Model 환경 구축
-
ReturnZero Day 1643: 모델 레지스트리 구조화 및 전사 장애 분석
-
Day 331. 2022-05-27
-
Greedy Confidence 및 Entropy 기반 신뢰도 추론 아키텍처
-
ReturnZero Day 1500: 현대캐피탈 고도화 및 utterance_save 암호화 구현
-
SIMS 암호화 구현 및 다국어 모델 파이프라인 논의
-
프로젝트 Bled 중단 및 SAC 프로젝트 집중
-
Python Client 초기 배포 및 구조 검토 (Day 358)
-
Day 1043: PII Redaction Filter 개발 및 On-Prem 모델 관리
-
Day 1036: 상태 확인 및 기술적 장애물
-
GOP 개발 및 기술적 고민 (2022-07-13)
-
일본어 ASR 파인튜닝 준비 및 코드 수정
-
옵셔널 구문 설계
-
현대캐피탈 고도화 및 utterance_save 암호화 구현 현황 (2025-08-05)
-
Day 490. 2022-11-02
-
PII 영향 분석)
-
Day 323. 2022-05-19
-
CTC Align 실패 현상 및 대안 탐색 (Day 672)
-
PVI 모델 개선 및 일본어 ASR 이슈 분석
-
PVI 성능 개선 및 일본어 ASR 모델 이슈 분석
-
WFST 엔진 구현 및 토큰 파싱 로직 설계
-
현대캐피탈 고도화 이슈 대응 및 utterance_save 암호화 구현
-
현대캐피탈 고도화 및 utterance 암호화 구현 진행 상황
-
다듬이 마무리 (Day 702)
-
Dadumi 배포 및 샌드박스 테스트 진행 상황 (Day 695)
-
Triton 배포 및 모델 컴파일 파이프라인 정리 (Day 576)
-
Day 335. 2022-05-31
-
ReturnZero 일본어 배포 및 문서 수정 (Day 1545)
-
Triton 이미지 교체 및 Pronaia Engine 배포 작업
-
현대캐피탈 Triton 서버 빌드 및 성능 벤치마크 (Day 1112)
-
Day 1104 (2024-07-09) - ReturnZero Daily Note
-
현대캐피탈 고도화 및 utterance_save 암호화 구현 현황 (2025-08-06)
-
현대캐피탈 고도화 및 utterance 암호화 구현 현황
-
Day 1055: 전사 품질 필터링 및 Triton E2E 디코딩 오류 분석
-
TCER) 구현 분석
-
주소 인식 모델 (Address Model) 성능 분석 및 트러블슈팅
-
TMN 회의: 일본어 4자리 숫자 인식 오류 분석
-
일본어 TTS 기반 학습 및 주소 전사 실험 노트
-
현대캐피탈 고도화: utterance_save 암호화 구현 진행 상황
-
VITO 요약 회의 및 RoBERTa 의도 분석 모델 논의
-
Day 847: Triton 테스트 환경 구축 및 특허 전략 논의
-
워커 3단 배포 전략 및 차트 개발 현황
-
ReturnZero Day 582: 워크플로우 연동 및 Triton 배포 계획
-
Day 212. 2022-01-28
-
ReturnZero Day 1061: STT 엔지니어링 및 평가 현황
-
WFST 테스트 코드 및 규칙 개발 (Day 391)
-
Day 390: 핵심성분 분석 및 WFST 테스트 진행
-
3i4k 모델 성능 저하 분석 및 Pronaia 클라이언트 개발 현황
-
현대캐피탈 고도화 및 utterance_save 암호화 구현 현황 (2025-08-04)
-
현대캐피탈 고도화: 반입 준비, 취약점 스캔, utterance 암호화 구현
-
ASR 성능 벤치마크 및 SER 이슈 분석 (2024-07-18)
-
Day 92: S-72 적용, S-118 DB 에러 분석, 백준 16235 시뮬레이션 구현
-
회의록 요약(Action Item 추출) 연구 서베이 및 난점 분석
-
2018-07-31 AWS 교육 및 전세 탐색
-
S-41 (Wipeable Column) 문제 해결 및 SommersV4 분석
-
TMN 음성 인식 오류 분석 및 개선 과제 (2024-04-09)
-
데이터 랜덤픽 구현 및 라이브 피드 아키텍처 설계
-
SAC 알고리즘의 GPU 최적화 및 성능 병목 분석
-
Day 931. 2024-01-18
-
배포 워크플로우 논의 (Day 859)
-
Triton 서비스 확장 및 Helm Chart 문제
-
Day 727: vitoworker 테스트 복구 및 PoC 준비
-
Day 61 (2021-08-30) - ReturnZero 일지
-
Day 536. 2022-12-18
-
ReturnZero Day 482: 비즈니스 통화 스크립트 검토 및 결과 비교 실험
-
Day 372 (2022-07-07) 작업 기록
-
2026-01-27 업무: 제로원 TTS, 일본어 ASR 개선, 두나무 유지보수
-
ReturnZero Day 1622: STT 파이프라인 개선 및 배포 인프라 작업
-
SIMS 모델 배포 및 게이트웨이 설정 작업
-
2024-09-19 업무: 일본어 STT 모델 튜닝 및 Prefix Decoder 디버깅
-
MWW 일본어 배포 및 가독성 평가 실험 (2024-07-24)
-
팀벨 프로젝트: 개인정보 필터링 및 서버 구축 작업
-
Pronaia Engine Keyword Boosting 모델 전사 테스트 및 배포 준비
-
기가코리아 개발 회의
-
CloudWorker 아키텍처 및 통신 프로토콜 설계 검토
-
다듬이: Turn 기반 처리 파이프라인 재설계 및 Pandas 인덱스 문제
-
Triton Inference Server 성능 저하 및 메모리 누수 원인 분석
-
ITN 성능 병목 분석 및 일본어 전사 개선 방향
-
delete 성능 이슈 및 무한 리트라이 분석
-
NLP 모델 오류 패턴 분석 및 개선 방안 (2022-10-28)
-
rtzr-stt 파이프라인 개선 및 STT 인식 오류 분석 (2025-11-12)
-
Day 966. 2024-02-22
-
Day 875. 2023-11-23
-
dadumi한테 어떻게 task를 줄건데
-
ITN 모델 최적화 및 데이터 전처리 작업 기록
-
Triton Export 및 버전 호환성 문제
-
Day 303: 모델 이미지 재배포 및 TTS 연구 시작
-
2026-04-23 업무: PVI 및 일본어 ASR 개선
-
S2 리빌드 문서화 및 다국어 RTFx 측정 환경 구축
-
2024-12-03 작업 일지: 시스템 튜닝 및 배포
-
Day 1022 (2024-04-18) - ReturnZero Daily Note
-
ITN 성능 벤치마크 및 토큰화 버그 분석
-
2025-06-05 업무: SIMS 로깅, dadumi 에러 분석, 현대캐피탈 현행화 준비
-
ReturnZero Day 495: 화자 분리 실패와 룰 기반 FP 감수
-
현대캐피탈 고도화 운영 준비 및 SIMS 암호화 구현 현황
-
일본어 음성 인식(ASR) 전사 파이프라인 디버깅 및 경량화 시도
-
Day 942: vito-worker 배포 및 STT 파이프라인 설정
-
한국어 배포 준비
-
Day 901. 2023-12-18
-
Qoo10 일본어 ASR 파이프라인 및 엔진 성능 테스트 (Day 797)
-
2023-08-08 작업 일지: 일본어 학습, MWW 배포, Dadumi
-
2023-07-05 작업 계획 및 MWW 연동 이슈 해결
-
fp16 테스트 실패 및 배포 작업 기록
-
일본어 ASR 얼라인 및 ITN 파이프라인 개발 (Day 635)
-
2023-02-24 작업 기록: 일본어 STT 조사 및 통합 ITN 설계
-
ReturnZero Day 1765: PVI 및 일본어 ASR 모델 개선 현황
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-13)
-
2026-01-14 업무 및 일본어 모델 배포 준비
-
2025-10-15 업무 및 일본어 ASR 모델 평가
-
팩맨TF 및 dadumi-worker 아키텍처 리팩토링 고려사항
-
삼성 SW 검정 프로페셔널 준비 및 재원 형과의 대화
-
2025-01-22 업무 진행 사항: 팩맨 저장소 변경, 워커 테스트셋 구조 개선, 코드 리뷰
-
ITN 규칙 대응 및 Kiwi 기반 NLP 파이프라인 개선
-
Rule-based NER 및 Semantic Role Labeling 구현 전략
-
스트림 구현 및 아키텍처 고민
-
Day 995. 2024-03-22
-
Pronaia Online 서비스 운영 및 리소스 모니터링
-
주소 인식 모델 성능 검증 및 Triton 배포 전략
-
Day 904: STT 학습 기능 논의 및 배포 준비 (2023-12-21)
-
일본어 개발계 배포 준비 및 장애 대응
-
MWW 한국어 개발계 배포 및 기술적 장애 대응 (2023-11-15)
-
ReturnZero Day 858: Confidence Score 적용 및 모델 변경
-
ReturnZero Day 764: 헬름차트 변경 및 배치 처리 아키텍처 논의
-
2023-07-27 작업 계획: 일본어 모델 배포 및 Triton 설정
-
E2E ASR 모델 Triton 서빙 환경 구축 및 테스트 (Day 723)
-
프로나이아 엔진 아키텍처 및 운영 이슈 (Day 715)
-
ITN Triton 통합 배포 및 스레드 풀 문제
-
2023-03-04 작업 진행 사항 (NLP4STT, 일본어 데이터셋, rt-dadumi)
-
pysommers 개발 진행 상황 및 반성 (2023-01-03)
-
2022-11-21 작업 기록: 한글 교정 로직 수정 및 Highlighter PoC 환경 설정
-
ReturnZero Day 359: Python Client 완료 및 3i4k 데이터 FP 검증 시작
-
SUJ-298 메일 전송 설정 및 클라이언트 호환성 문제 (2021-07-26)
-
2026-05-21 업무: PVI 및 일본어 ASR 모델 개선 현황
-
ReturnZero Day 1785: PVI, 일본어 ASR 개선 및 MWW 배포
-
ReturnZero Day 1748: PVI 및 일본어 ASR 개선 작업
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-16)
-
TTS 개선 및 S2 리빌드
-
2025-08-25 업무: 현대캐피탈 TTS 장애, utterance 암호화, 일본어 모델 디버깅
-
MWW EKS 배포 장애 및 RT-Annotation 문서화 개선
-
팀벨(Timbel) 평가(Eval) 시스템 디버깅 및 인프라 설정
-
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
-
AICT 문장 띄어쓰기 벤치마크 및 워커 컨테이너 테스트
-
Day 90: Git 실수, 데드락 논의, Logstash Cron 구현
-
약속) 성능 분석 및 정제 전략
-
팀벨 개발 환경 설정 및 SIMS 배포 준비 (Day 959)
-
MWW 한국어 STT 배포 및 SIMS Backend 아키텍처 검토
-
mww 운영계 배포 아키텍처 및 구성 요소
-
ReturnZero Day 903: 모델 최적화 시도 및 성능 벤치마크
-
Day 844. 2023-10-23
-
Day 820. 2023-09-28
-
Day 8. 2021-07-08
-
Day 693. 2023-05-24
-
ITN 개발 및 에이전트 아키텍처 논의 (Day 680)
-
다듬이 및 일본어 모델 처리 논의 (Day 642)
-
일본어 ASR 파이프라인 설정 및 실험 기록
-
일본어 STT 이슈
-
Day 589. 2023-02-09
-
Total ensemble model
-
업라이즈 AI바우처: 금융 콘텐츠 요약 서비스 및 NLP4STT 기술적 장애물
-
일본어 ITN 서비스 배포 및 테스트 진행 상황
-
Day 497. 2022-11-09
-
프로나이아 모델 배포 및 스마트 어터런스 처리 로직 설계
-
Day 461. 2022-10-04
-
Day 428. 2022-09-01
-
2022-06-20 워크샵 및 모델 실험 기록
-
삼성 마지막 날: GRPC 서버 개발 및 TTS 요구사항 정의
-
PVI 및 일본어 ASR 모델 개선 현황 (2026-05-22)
-
2026-05-14 업무 및 기술 이슈 요약
-
ASR 모델 개선 현황: PVI, 일본어, MWW 화물맨
-
ReturnZero Day 1749: PVI 및 일본어 ASR 개선 작업
-
ReturnZero Day 1743: PVI, 일본어 ASR 개선 및 신한 SDK 빌드
-
Primary Voice Isolation(PVI) 평가 환경 구축 및 신한 SDK 16kHz 대응
-
TTS 개선 및 S2 리빌드
-
2026-01-22 업무 및 모델 개선 이슈
-
2026-01-20 업무: 제로원 TTS 데이터 정제 및 일본어 STT 모델 배포 가이드
-
ReturnZero Day 1625: 웰컴용 Translator 패키징 및 일본어 모델 개선
-
현대캐피탈 차량번호 인식 모델 파인튜닝 및 SIMS 일본어 환경 구축
-
릴단 파드 및 Triton Server 배치 구성 (Helm Values)
-
2024-09-24 업무 진행 사항: 주소 모델 배포 및 시스템 테스트
-
MWW EKS 배포 장애 및 STT 모델 평가 이슈 (Day 1168)
-
MWW EKS 환경 접속 및 배포 준비 (Day 1153)
-
ReturnZero Day 1147: AM 모델 학습 API 테스트
-
Day 1105. 2024-07-10
-
ReturnZero Day 124: 쿠폰함 구현 및 기획 변경
-
WFST 코드 보완 및 분류 모델 성능 평가 (Day 400)
-
일본어 가타카나 인식에서 음절 절단 문제 분석
-
Day 125: 쿠폰함 구현 및 DB 연결 문제 해결
-
SIMS 헬름 구성 및 파이프라인 자동화 고민
-
Day 897: E2E 테스트, 데이터 증강 및 LM 적용 논의
-
ReturnZero Day 837: 일본어 ASR 평가 및 엔진 개발
-
qoo10 일본어 서버 재가동 및 헬름차트 설정
-
통합 ITN 및 S2 Phase 1 진행 상황 (2023-06-05)
-
Callabo STT 성능 개선 및 일본어 Qoo10 데이터 얼라인 전략
-
다듬이: 일본어 ITN 및 배포 준비
-
2023-03-23 작업 기록: 일본어 ITN 및 Qoo10 ASR 정렬
-
Day 610: 태스크 정리 (NLP4STT, 다듬이, 일본어 데이터)
-
오전 업무 스몰토크 (Day 597)
-
GEC 모델 ONNX 변환 및 NLP4STT 진행 상황
-
RL 모델 서빙 고민
-
Project-K 지역락 이슈 및 모델 이미지 재퍼블리시
-
Day 187. 2022-01-03
-
2026-05-15 업무: PVI, 일본어 ASR, MWW 배포 이슈
-
화물맨 ASR 도메인 특화 및 일본어 모델 개선 현황
-
PVI 최적화 및 일본어 ASR 모델 개선 현황 (2026-05-06)
-
ReturnZero Day 1756: PVI 및 일본어 ASR 개선 이슈
-
ReturnZero Day 1745: PVI, 일본어 ASR 개선 및 Kubernetes 보안 검토
-
2026-04-09 업무: PVI, 일본어 ASR 개선 및 TTS 관리 기능 개발
-
Primary Voice Isolation(PVI) 및 신한은행 다국어 STT 대응 현황
-
ReturnZero Day 1736: PVI 및 일본어 ASR 개선 현황
-
차트 개선
-
MWW-TMN 배포 및 인프라 문제 해결 (2025-10-21)
-
KISA 프로젝트 준비 및 일본어 STT 모델 실험 (Day 1570)
-
2025-09-03 업무: SIMS 일본어화 및 현대캐피탈 고도화 진행 상황
-
2025-08-11 업무: 현대캐피탈 고도화, utterance_save 암호화, Next Model, 신한카드
-
일본어 STT 모델 벤치마킹 및 인프라 작업 기록 (2025-01-14)
-
dadumi lang 포함
-
일본어 ASR 모델 학습 및 데이터 전처리 진행 상황 (2024-07-15)
-
Day 1106. 2024-07-11 업무 요약
-
일본어 코드모델 (파나소닉 모델명 인식)
-
2024-05-29 업무 및 기술 작업 기록
-
ReturnZero Day 1058: ASR 파이프라인 진행 상황 및 버그 수정
-
ReturnZero 데이터셋 전처리 및 pysommers 파이프라인 디버깅
-
일본어 데이터셋 구축 및 전사 파이프라인 디버깅
-
Day 1. 2021-07-01
-
WFST 엔진 구현 및 Commitment 작업 (Day 392)
-
RLLib 얼라인: 학습 코드 검토 및 Google Trends 데이터 검증
-
Day 145: 쿠폰함 디버깅, 코드 프리즈 및 트랜스크라이버 성능 분석
-
데드락 해결 및 서비스 이슈
-
Day 41: VITO 비활성 사용자 분석 및 Serverless 도입 고민
-
Qoo10 전사 오류 원인 분석 및 카타카나 모델 벤치마크
-
코드 리뷰 진행
-
MWW VAD 임계값 수정 및 테스트
-
PRONAIA 엔진 ITN 파이프라인 오류 (FstOpError)
-
BMT 모델 테스트 및 인프라 설정 (2024-01-05)
-
Pronaia STT 환경 설정 및 특허 미팅 기록 (Day 917)
-
ReturnZero Day 860: STT 모델 수정 및 성능 벤치마크
-
Day 750: Helm Chart, Pronaia Proxy Logic, and Docker Build Tasks
-
VITOSpeech Engine 동시접속 제한 및 현대캐피탈 PoC 준비
-
프로나이아(Pronaia) 일본 배포 및 API 접근 제어 아키텍처 논의
-
일본어 ASR 모델 디버깅 및 성능 비교 (Day 704)
-
NLP 문제 정의
-
Day 657: Vito Worker 배포 및 rt-neural-itn Torch 의존성 제거
-
Day 369. 2022-07-04
-
3i4k 데이터셋을 활용한 화행분류 Feasibility 검토
-
Day 21. 2021-07-21
-
Day 181: 배포 장애 대응 및 Triton 서버 학습 계획
-
2026-05-28 업무 및 기술 이슈 요약
-
ReturnZero Day 1762: PVI 및 일본어 ASR 개선 현황
-
Primary Voice Isolation(PVI) 및 일본어 ASR 개선 현황
-
Primary Voice Isolation 및 일본어 ASR 개선 과제
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-19)
-
TTS 모델 개선 및 S2 리빌드
-
ITN 개선 및 제로원 착수 준비
-
rtzr-stt Pacman 개선 및 부산소방 이슈 대응 (2025-11-10)
-
MWW 사업 리뷰 및 오뚜기 음성 인식 이슈 대응
-
2025-10-16 업무: 일본어 STT 실험 및 KISA 프로젝트 준비
-
2025-10-14 업무: 일본어 STT 튜닝 실험 및 제로원 제안서 초안
-
SIMS 일본어 설치 및 현대캐피탈 모델 고도화 진행 상황
-
2025-08-21 업무: 현대캐피탈 고도화, utterance 암호화, Next Model 배포
-
현대캐피탈 고도화: SIMS 배포 및 환경 설정 (Day 1465)
-
스케줄링 이슈
-
MWW EKS 인프라 설정 및 API 테스트 기록
-
2024-05-17 업무 기록: 키워드 부스트 모델 배포 및 개발 환경 설정
-
일본어 음성 인식 모델 테스트 결과 (2024-04-15)
-
오프로딩: 속도 할당 및 유틸리티 함수 설계
-
2026-03-19 일지: k3s 및 Stamcord 작업
-
발표 스킬 및 연구 이슈 정리 (2019.12.17)
-
Stock Trader 데이터 준비 및 아키텍처 검토
-
Whisper 실시간 스트리밍 솔루션 탐색
-
RecordExtra 데드락 문제 및 Gap Lock 분석
-
Day 121: 쿠폰함 구현 및 데드락 이슈 대응
-
Day 119: 쿠폰함 구현 및 DB 호환성 논의
-
미팅 요약 서베이 및 화행 분석
-
S-54 이슈 분석
-
쿠폰함 Redeem 테스트 코드 작성 및 코드 커버리지 도입
-
MWW 배포 및 ASR 파이프라인 디버깅 (2024-03-12)
-
MWW 한국어 SIMS 평가 및 커넥션 릭 재현 테스트
-
SIMS 개발계 배포 및 Envoy gRPC 로드밸런싱 설정
-
MWW 배포 회고 및 테스트 데이터셋 구성 전략
-
Day 946: YouTube 데이터 파이프라인 실험 및 Worker 테스트 이슈
-
일본어 ITN 테스트 및 데이터 문제 확인
-
일본어 이름 모델 검증 및 T4 배포 준비
-
Trt) 시도 및 실패 기록
-
일본어 ASR 모델 실험 및 데이터 파이프라인 개선 (Day 811)
-
ASR 파싱 및 인프라 요구사항 (Day 791)
-
2023-08-28 일일 작업 기록: 일본어 데이터 분석, 현대캐피탈 장애 대응, GPU Operator 설치
-
2023-08-22 작업 일지: 일본어 데이터 전처리 및 Pronaia 테스트 환경 구축
-
TED 일본어 데이터셋(테스트용)
-
2023-07-31 일일 작업 기록 및 장애 대응
-
다듬이 (2023-07-06)
-
주소 교정 (Address Correction)
-
Day 699: dadumi 배포 및 일본어 ASR 평가
-
ReturnZero Day 686: 큐 병목 및 Worker 성능 저하 대응
-
AWS CLI 환경 설정 및 Triton Server 배포 준비
-
NLP4STT 프로젝트 마무리 및 팀원 이탈 회고
-
Day 6. 2021-07-06
-
긴 입력 처리 아키텍처 검토 (Day 586)
-
2023-01-05 일지: pysommers 배포 문제 해결, NLP4STT 띄어쓰기 모델 최적화 및 사업계획
-
2022-07-11 일일 작업 기록: Pynini 트랜스듀서 디버깅 및 MariaDB 환경 설정
-
ReturnZero Day 1794: PVI 및 일본어 ASR 개선 현황
-
ASR 모델 개선 및 프로젝트 진행 현황 (2026-05-07)
-
PVI 성능 최적화 및 일본어 ASR 모델 개선 현황
-
Primary Voice Isolation (PVI) 성능 평가 및 일본어 ASR 개선 계획
-
S2 리빌드 및 스택빌더 이슈 해결
-
2026-02-03 업무: 일본어 ASR 모델 개선 및 Triton 배포 환경 최적화
-
2026-01-23 업무: 제로원 집중 및 일본어 STT 개선
-
RTZR 일본어 STT 개발 이력 및 인프라 현황
-
RTZR 일본어 ASR 개발 이력 및 모델 레지스트리 구조
-
차트 개선 및 두나무 EKS 접속 이슈
-
2025-11-07 업무 진행 상황: MWW 모델 평가 및 rtzr-stt 개선
-
일본어 데이터 정제 및 전처리 파이프라인 (Day 1562)
-
2025-09-16 일본어 모델 배포 및 설정 작업
-
현대캐피탈 Numberplate 모델 장애 진단 및 일본어 T4 모델 준비
-
2025-09-12 업무 우선순위: 일본어 배치 및 GPT 작업
-
2025-09-11 업무 진행 상황: 일본어 TMN, dadumi, 현대캐피탈
-
현대캐피탈 차량번호 인식 모델 고도화 및 데이터 필터링
-
2025-08-26 업무 진행 사항: sommers ja 테스트, 현대캐피탈 고도화, utterance_save 암호화
-
Day 1426. 2025-05-26 - 업무
-
Day 14. 2021-07-14
-
2025-01-08 업무 및 기술 노트
-
2024-11-04 업무 및 기술 이슈 요약
-
일본어 STT 모델 튜닝 및 팀벨 서비스 장애 대응
-
일본어 주소 인식 모델 배포 및 MWW STT 성능 검증
-
RTZR STT 서비스 K8s 네트워킹 문제 해결
-
Pronaia Engine 필터링 및 아키텍처 도식화 (Day 1044)
-
VS Code Remote-SSH 연결 로그 (pierce.rtzr.ai)
-
쿠폰함 페어코딩 및 테스트 코드 작성 (Day 162)
-
강화학습 기반 암호화폐 자동매매 프로젝트 제안
-
Day 127: 쿠폰 기능 구현 및 알고리즘 문제 풀이 (숨바꼭질, 지하철 2 호선, 게임 개발)
-
Qoo10 rtboost 구현 및 dadumi aligner 알고리즘 설계 고민
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
쿠폰함 기능 구현 및 DB 스키마 설계 (Day 163)
-
쿠폰함 서비스 개발 및 서버 코드 리팩토링 (Day 132)
-
신한카드 프로젝트: vito-worker 배포 및 전사 오류 분석
-
ReturnZero Day 958: 한자 인식 성능 평가 및 VAD 파라미터 튜닝
-
Conformer 모델 앙상블 및 BLS 통합 실험 (Day 910)
-
일본어 Pronaia 배포 및 ITN 파이프라인 실험
-
일본어 STT 개발계 배포 및 벤치마크 실행 기록 (Day 872)
-
출장 정리 및 이름 모델 개선 계획 (2023-11-14)
-
dadumi-whisper 파이프라인 개선 및 현대캐피탈 업무
-
2023-09-07 작업 기록: 일본어 ASR 모델 학습 및 MWW 업무
-
일본어 데이터 전처리 및 정제 규칙 (Day 790)
-
대방 방문 작업 목록 및 기술적 이슈 (2023-08-16)
-
Qoo10 데이터 정규화 및 장애 대응 기록
-
제한 테스트
-
일본어 ASR 파이프라인 구축 및 Forced Alignment 문제 해결 시도
-
ITN 파이프라인 통합 및 일본어 정규화 작업 현황 (Day 602)
-
rt-gec 토크나이저 이슈 및 일본어 ITN 학습 데이터 가이드라인
-
Day 588: 띄어쓰기 교정 실험 및 KAIST 채용 심사 기록
-
띄어쓰기 모델 변환 및 성능 테스트
-
NLP4STT 점검: ITN, TER 메트릭 및 테스트셋 구축
-
NLP4STT: ITN 평가 메트릭 및 pysommers 의존성 고민
-
일본어 숫자 및 날짜 처리 로직 개선 (Day 533)
-
2022-12-13 작업 기록: NLP 파이프라인 디버깅 및 일본어 ITN 통합
-
프로나이아 패키지화 및 3i4k FP 검증
-
일본어 ASR 이슈 및 UBase 타운홀 요약
-
ASR 모델 개선 현황: PVI, 일본어, 화물맨 도메인
-
PVI 최적화 및 일본어 ASR 모델 개선 현황 (2026-04-29)
-
Primary Voice Isolation 및 일본어 ASR 개선 현황 (2026-03-31)
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 계획
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-04)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-02-27)
-
2026-02-26 업무 일지: 일본어 ASR 개선 및 S2 리빌드
-
TTS 모델 개선 및 S2 리빌드 진행 상황
-
제로원 프로젝트 진행 상황 및 기술적 이슈 (2026-01-12)
-
ReturnZero Day 1650: 업무 현황 및 제로원 TTS TN 설계 초안
-
2026-01-02 업무 및 제로원 TTS TN 프로젝트 킥오프
-
ReturnZero Day 1645: 모델 레지스트리 및 웰컴용 STT 패키징 진행
-
ReturnZero 모델 레지스트리 구조화 및 업무 현황 (Day 1633)
-
Day 1590. 2025-11-06 - 업무 진행 상황
-
2025-09-02 업무: 일본어 T4, 현대캐피탈 고도화, utterance 암호화
-
2025-08-27 업무 우선순위 및 기술 이슈