본 노트는 MoE(Expert 혼합) 아키텍처와 멀티뷰 데이터 증강 기법에 대한 학습 난이도 및 개념 정리를 기록하고 있다. 특히 발화 데이터를 다양한 시간 구간으로 분할하여 다중 관점에서 학습하는 방식을 언급한다. 또한, vLLM 서빙 엔진의 핵심 기술인 Paged Attention과 Ray Cluster 활용, OpenAI API 호환성 등을 통해 기존 Transformer 라이브러리 대비 성능 우위와 로컬 배포 가능성을 확인하는 과정을 담고 있다.
-
2024-04-18 일지: RL 학습 환경 구성 및 시스템 아키텍처 구상
-
알고리즘 학습
-
Day 1015: 음성 전처리 교정 및 LLM 임베딩 학습
-
Day 323. 2022-05-19
-
Gemma2 기술 검토
-
Deview 2023 2일차: NSML, Seq2Seq Clova, Clova Vision, 파파고 QE, HyperCLOVA 요약
-
ReturnZero Day 1062: 워크샵 및 거대모델 대체 전략 논의
-
2025-06-09 일기: 미루기 습관 개선, LLM 추론 한계, 로컬 LLM 서빙
-
Day 901. 2023-12-18
-
Day 428. 2022-09-01
-
Day 589. 2023-02-09
-
Day 30. 2021-07-30
-
ReturnZero Day 814: 일본어 모델 학습 속도 문제 및 해결
-
Day 497. 2022-11-09
-
Day 536. 2022-12-18
-
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
-
Day 875. 2023-11-23
-
ReturnZero Day 1147: AM 모델 학습 API 테스트
-
Day 490. 2022-11-02
-
2023-09-07 작업 기록: 일본어 ASR 모델 학습 및 MWW 업무
-
배포 워크플로우 논의 (Day 859)
-
ReturnZero Day 837: 일본어 ASR 평가 및 엔진 개발
-
Qoo10 일본어 ASR 파이프라인 및 엔진 성능 테스트 (Day 797)
-
Day 8. 2021-07-08
-
일본어 ASR 모델 디버깅 및 성능 비교 (Day 704)
-
ReturnZero 일본어 배포 및 문서 수정 (Day 1545)
-
MWW 배포 및 ASR 파이프라인 디버깅 (2024-03-12)
-
Day 820. 2023-09-28
-
일본어 ASR 파이프라인 구축 및 Forced Alignment 문제 해결 시도
-
일본어 ASR 얼라인 및 ITN 파이프라인 개발 (Day 635)
-
Day 181: 배포 장애 대응 및 Triton 서버 학습 계획
-
일본어 음성 전사 파이프라인 설계 및 고려사항
-
ReturnZero Day 1047: 일본어 ASR 모델 검증 및 성능 분석
-
Day 693. 2023-05-24
-
일본어 ASR 모델 실험 및 데이터 파이프라인 개선 (Day 811)
-
ReturnZero Day 1061: STT 엔지니어링 및 평가 현황
-
ASR 파싱 및 인프라 요구사항 (Day 791)
-
Day 61 (2021-08-30) - ReturnZero 일지
-
ReturnZero Day 582: 워크플로우 연동 및 Triton 배포 계획
-
신한카드 RFI 대응 및 STT 엔진 개발 현황 (Day 1034)
-
일본어 TTS 기반 학습 및 주소 전사 실험 노트
-
Day 699: dadumi 배포 및 일본어 ASR 평가
-
Day 1104 (2024-07-09) - ReturnZero Daily Note
-
Day 847: Triton 테스트 환경 구축 및 특허 전략 논의
-
ReturnZero Day 1622: STT 파이프라인 개선 및 배포 인프라 작업
-
프로나이아 엔진 아키텍처 및 운영 이슈 (Day 715)
-
일본어 ASR 모델 훈련 성능 저하 관찰 (Day 1571)
-
다듬이 및 일본어 모델 처리 논의 (Day 642)
-
Day 1043: PII Redaction Filter 개발 및 On-Prem 모델 관리
-
E2E ASR 모델 Triton 서빙 환경 구축 및 테스트 (Day 723)
-
일본어 ASR 모델 학습 및 데이터 전처리 진행 상황 (2024-07-15)
-
ReturnZero Day 1643: 모델 레지스트리 구조화 및 전사 장애 분석
-
ReturnZero Day 903: 모델 최적화 시도 및 성능 벤치마크
-
ITN 개발 및 에이전트 아키텍처 논의 (Day 680)
-
Day 1022 (2024-04-18) - ReturnZero Daily Note
-
SetFit 제로샷 분류 실험 및 ReturnZero 현황 (Day 545)
-
ReturnZero Day 1645: 모델 레지스트리 및 웰컴용 STT 패키징 진행
-
ReturnZero Day 832: 일본어 인식 실험 및 Prefix Decoder 평가
-
ReturnZero Day 1489: utterance 암호화 구현 및 Next Model(일본어) 탐색
-
일본어 ASR 모델 성능 검증 및 디버깅 (Day 708)
-
ReturnZero Day 359: Python Client 완료 및 3i4k 데이터 FP 검증 시작
-
ReturnZero Day 860: STT 모델 수정 및 성능 벤치마크
-
ReturnZero Day 858: Confidence Score 적용 및 모델 변경
-
ReturnZero Day 764: 헬름차트 변경 및 배치 처리 아키텍처 논의
-
Day 303: 모델 이미지 재배포 및 TTS 연구 시작
-
Day 1106. 2024-07-11 업무 요약
-
Vocab 실험 및 작업량 분석
-
ReturnZero Day 1058: ASR 파이프라인 진행 상황 및 버그 수정
-
Day 1036: 상태 확인 및 기술적 장애물
-
Conformer 모델 앙상블 및 BLS 통합 실험 (Day 910)
-
ReturnZero Day 482: 비즈니스 통화 스크립트 검토 및 결과 비교 실험
-
Day 902: Audio Feature Extraction & Model Check
-
다듬이 마무리 (Day 702)
-
ReturnZero 분류 모델 성능 보정 실험 (Day 401)
-
ReturnZero Day 532: Kiwi 모델 검증 및 일본어 숫자 태깅 규칙 분석
-
Day 897: E2E 테스트, 데이터 증강 및 LM 적용 논의
-
오전 업무 스몰토크 (Day 597)
-
ReturnZero Day 686: 큐 병목 및 Worker 성능 저하 대응
-
ReturnZero Day 291: gRPC 로직 및 Ali-phone 정렬 디버깅
-
Day 365: VTS Trial 실험 결과 및 SAC 킥오프
-
긴 입력 처리 아키텍처 검토 (Day 586)
-
다듬이 (Day 663)
-
ReturnZero Day 495: 화자 분리 실패와 룰 기반 FP 감수
-
Day 844. 2023-10-23
-
Day 187. 2022-01-03
-
Day 335. 2022-05-31
-
Day 995. 2024-03-22
-
Day 461. 2022-10-04
-
Day 966. 2024-02-22
-
Day 931. 2024-01-18
-
Day 448. 2022-09-21
-
Day 212. 2022-01-28
-
Day 369. 2022-07-04
-
Day 1. 2021-07-01
-
Confidence 구현
-
Day 331. 2022-05-27
-
Day 14. 2021-07-14
-
Day 455. 2022-09-28
-
Day 588: 띄어쓰기 교정 실험 및 KAIST 채용 심사 기록
-
Day 527. 2022-12-09
-
Day 471. 2022-10-14
-
Day 301. 2022-04-27
-
Day 285. 2022-04-11
-
ReturnZero Day 1118: 음성 인식 전사 오류 및 WFST 디코더 호환성 문제
-
Day 1105. 2024-07-10
-
ReturnZero Day 640: 텍스트 처리 파이프라인 리팩토링 및 세그멘테이션 이슈
-
Day 264. 2022-03-21
-
Project-K 지역락 이슈 및 모델 이미지 재퍼블리시
-
ReturnZero 데이터셋 전처리 및 pysommers 파이프라인 디버깅
-
ReturnZero Day 958: 한자 인식 성능 평가 및 VAD 파라미터 튜닝
-
Day 372 (2022-07-07) 작업 기록
-
VITO 요약 회의 및 RoBERTa 의도 분석 모델 논의
-
Day 516. 2022-11-28: Kiwi 모델 구축 API 화 및 콜라보 하이라이터 프로토타이핑
-
BLS 구현 및 배포 준비 (Day 694)
-
ReturnZero Day 476: Message Commitment & Townhall Notes
-
일본어 STT 모델 배포 준비 및 성능 평가 (Day 838)
-
ReturnZero Day 488: 팀 기조 변경 및 NLP 전략 재정의
-
Triton 배포 및 모델 컴파일 파이프라인 정리 (Day 576)
-
ReturnZero Day 1749: PVI 및 일본어 ASR 개선 작업
-
Day 904: STT 학습 기능 논의 및 배포 준비 (2023-12-21)
-
ReturnZero Day 1756: PVI 및 일본어 ASR 개선 이슈
-
Day 6. 2021-07-06
-
Python Client 초기 배포 및 구조 검토 (Day 358)
-
Day 942: vito-worker 배포 및 STT 파이프라인 설정
-
ITN 모델 배포 및 성능 튜닝 (Day 666)
-
ReturnZero Day 1762: PVI 및 일본어 ASR 개선 현황
-
ReturnZero Day 1794: PVI 및 일본어 ASR 개선 현황
-
ReturnZero Day 1785: PVI, 일본어 ASR 개선 및 MWW 배포
-
ReturnZero Day 1765: PVI 및 일본어 ASR 모델 개선 현황
-
ITN 개선 및 제로원 착수 준비
-
ReturnZero Day 1736: PVI 및 일본어 ASR 개선 현황
-
일본어 ASR 이슈 및 UBase 타운홀 요약
-
2022-06-20 워크샵 및 모델 실험 기록
-
주소 인식 모델 서빙 방식 결정: ONNX Dynamic vs TRT
-
Day 491: E2E 음성 인식 서버 배포 장애 및 Kaldi 대체안 검토
-
ReturnZero Day 1748: PVI 및 일본어 ASR 개선 작업
-
ReturnZero Day 1743: PVI, 일본어 ASR 개선 및 신한 SDK 빌드
-
데이터 전략 논의 (Day 845)
-
Torch 의존성 제거 및 Triton 이미지 배포 작업 (Day 658)
-
ReturnZero Day 1644: 모델 레지스트리 구축 및 웰컴용 STT 패키징
-
ReturnZero Day 1745: PVI, 일본어 ASR 개선 및 Kubernetes 보안 검토
-
Day 555: ONNX 모델 배포 및 환경 구성 고민
-
배포 테스트 (2024-09-11)
-
현대캐피탈 Triton 서버 빌드 및 성능 벤치마크 (Day 1112)
-
Pronaia Engine 필터링 및 아키텍처 도식화 (Day 1044)
-
T4 GPU 환경에서 WFST 모델의 성능 측정 (Day 876)
-
Day 300: 도커 배포, ivector 디버깅, gRPC 타임아웃 이슈
-
Day 727: vitoworker 테스트 복구 및 PoC 준비
-
주소 교정 (Address Correction)
-
ReturnZero Day 700: 샌박 테스트 결과 및 일본어 STT 프로젝트 현황
-
ReturnZero Day 1625: 웰컴용 Translator 패키징 및 일본어 모델 개선
-
Day 946: YouTube 데이터 파이프라인 실험 및 Worker 테스트 이슈
-
Day 657: Vito Worker 배포 및 rt-neural-itn Torch 의존성 제거
-
ReturnZero Day 1575: Series C 투자 유치 및 조직 위기 관리
-
KISA 프로젝트 준비 및 일본어 STT 모델 실험 (Day 1570)
-
일본어 STT 개발계 배포 및 벤치마크 실행 기록 (Day 872)
-
2023-08-08 작업 일지: 일본어 학습, MWW 배포, Dadumi
-
NLP 모델 오류 패턴 분석 및 개선 방안 (2022-10-28)
-
일본어 프로젝트 진행 상황
-
Day 530. 2022-12-12
-
Day 329. 2022-05-25
-
Triton Custom Backend 학습 계획 및 모델 웜업 개념 정리
-
ReturnZero 모델 레지스트리 구조화 및 업무 현황 (Day 1633)
-
새 일본어 고객 (Day 786)
-
VAD 임계값이 이름 학습 모델 성능에 미치는 영향 실험
-
BERT 모델의 ONNX 변환 및 Triton Server 배포 시도 (Day 559)
-
ReturnZero Day 1651: 업무 현황 및 제로원 TTS TN 정책 정의
-
ReturnZero Day 1650: 업무 현황 및 제로원 TTS TN 설계 초안
-
Day 315. 2022-05-11
-
Day 254. 2022-03-11
-
CTC Align 실패 현상 및 대안 탐색 (Day 672)
-
일본어 ASR 실험 및 Utterance Segmenter 개발 현황
-
Day 1125. 2024-07-30 - 업무
-
ITN 성능 시험 및 VAD 통합 테스트 진행 (Day 667)
-
Pronaia STT 환경 설정 및 특허 미팅 기록 (Day 917)
-
Dadumi 배포 및 샌드박스 테스트 진행 상황 (Day 695)
-
ReturnZero Day 1623: STT 파이프라인 개선 및 인프라 자동화
-
Day 800: 세팅 및 ITN 워커 스펙 변경
-
일본어 데이터 정제 및 전처리 파이프라인 (Day 1562)
-
polyglot-ko 서빙 준비도
-
gip-decoder 배포 및 TTS 아키텍처 검토
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-13)
-
2025-10-16 업무: 일본어 STT 실험 및 KISA 프로젝트 준비
-
Triton 이미지 교체 및 Pronaia Engine 배포 작업
-
MWW EKS 배포 장애 및 STT 모델 평가 이슈 (Day 1168)
-
Day 239. 2022-02-24
-
Day 610: 태스크 정리 (NLP4STT, 다듬이, 일본어 데이터)
-
2024-01-03 할 일: T4 변환 및 성능 평가
-
2026-04-23 업무: PVI 및 일본어 ASR 개선
-
PVI 성능 개선 및 일본어 ASR 모델 이슈 분석
-
Primary Voice Isolation 및 일본어 ASR 개선 현황 (2026-03-31)
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
TTS 모델 개선 및 S2 리빌드
-
2025-10-15 업무 및 일본어 ASR 모델 평가
-
2024-11-28 업무 및 실험 기록
-
2024-07-22 업무 및 회고: 일본어 ASR 모델 평가 및 인프라 구축
-
차트 개편
-
Day 356. 2022-06-21
-
Day 176. 2021-12-23
-
STT 실시간 엔진 배포 가이드 및 데이터셋 전처리 현황
-
2026-05-21 업무: PVI 및 일본어 ASR 모델 개선 현황
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-19)
-
Day 366. 2022-07-01
-
ReturnZero Day 594: 일본어 데이터 파이프라인 및 ITN 아키텍처 검토
-
ReturnZero 리빌딩 및 전략 회고 (Day 632)
-
띄어쓰기 모델 변환 및 성능 테스트
-
ReturnZero E2E 파이프라인 실행 순서 및 데이터 구조 분석
-
3i4k 모델 성능 저하 분석 및 Pronaia 클라이언트 개발 현황
-
TTS 개선 및 S2 리빌드
-
2024-09-19 업무: 일본어 STT 모델 튜닝 및 Prefix Decoder 디버깅
-
GPT-SoVITS 감정 표현의 무작위성 및 Gemini 3 평가
-
Day 364. 2022-06-29
-
Day 247. 2022-03-04
-
Day 15. 2021-07-15
-
일본어 ASR 프로젝트 현황 및 전략 논의 (Day 627)
-
MLOps 인프라 및 데이터 과학 공정 현황 (Day 251)
-
PRONAIA 엔진 ITN 파이프라인 오류 (FstOpError)
-
Day 390: 핵심성분 분석 및 WFST 테스트 진행
-
Day 385 (2022-07-20): WFST 개발 및 휴가 잔여일 계산
-
일본어 음성 인식(ASR) 전사 파이프라인 디버깅 및 경량화 시도
-
MWW 한국어 STT 배포 및 SIMS Backend 아키텍처 검토
-
ASR 모델 성능 평가 결과 (2023-10-02)
-
리팩토링 시도: cdrewrite 및 transducer 기반 태그 삽입 성능 문제
-
2026-05-15 업무: PVI, 일본어 ASR, MWW 배포 이슈
-
Primary Voice Isolation (PVI) 성능 평가 및 일본어 ASR 개선 계획
-
2026-04-09 업무: PVI, 일본어 ASR 개선 및 TTS 관리 기능 개발
-
S2 리빌드 문서화 및 다국어 RTFx 측정 환경 구축
-
2026-02-03 업무: 일본어 ASR 모델 개선 및 Triton 배포 환경 최적화
-
2026-01-23 업무: 제로원 집중 및 일본어 STT 개선
-
MWW 일본어 배포 및 가독성 평가 실험 (2024-07-24)
-
2024-07-21: ONNX 배포 실패 및 반기 회고
-
일본어 코드모델 (파나소닉 모델명 인식)
-
Pronaia Engine Keyword Boosting 모델 전사 테스트 및 배포 준비
-
일본어 음성 인식 모델 테스트 결과 (2024-04-15)
-
RLLib 얼라인: 학습 코드 검토 및 Google Trends 데이터 검증
-
GOP 프로젝트: ivector 문제 탐색 및 도커 배포 준비 (Day 299)
-
Day 177. 2021-12-24
-
Recall) 이해 및 HuggingFace Transformers 학습 코드 분석
-
테스트 진행 상황 (Day 965)
-
Triton 서버 구축 및 pysommers 데이터 전처리
-
WFST 엔진 구현 및 Commitment 작업 (Day 392)
-
KISA STT 솔루션 설치 및 환경 구성 (Day 1573)
-
BMT 엔진 벤치마크 오류 및 Helm 템플릿 수정
-
Day 1009: 팀벨 레이턴시 이슈 및 일본어 E2E 세그멘테이션
-
Day 665: ITN 모델 배포 장애 및 환경 정리
-
일본어 데이터 전처리 및 ITN 방침 (Day 623)
-
WFST 테스트 코드 및 규칙 개발 (Day 391)
-
주소 인식 모델 (Address Model) 성능 분석 및 트러블슈팅
-
mel2vec 영숫자 인식 성능 검증 및 패딩 실험 결과
-
일본어 ASR 모델 성능 벤치마크 및 문제점 (2023-09-25)
-
Trt) 시도 및 실패 기록
-
3i4k 모델 검증 및 VTS 테스트셋 평가 전략
-
Primary Voice Isolation 및 일본어 ASR 개선 과제
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-16)
-
TTS 모델 개선 및 제로원 준비
-
RTZR 일본어 STT 개발 이력 및 인프라 현황
-
일본어 ASR 모델 (Cutoff) 벤치마킹 및 배포 준비
-
Day 1426. 2025-05-26 - 업무
-
Stable Diffusion 모델 체크포인트 링크
-
압축 이슈 해결
-
Day 750: Helm Chart, Pronaia Proxy Logic, and Docker Build Tasks
-
모델 서빙 아키텍처 논의
-
Day 9. 2021-07-09
-
Day 19. 2021-07-19
-
2023-05-12 일본어 모델 학습 및 얼라인, ITN 서비스화 진행 상황
-
Kiwi 형태소 분석기 학습 데이터 확보 및 일본어 ITN 개발 현황
-
ReturnZero Day 1500: 현대캐피탈 고도화 및 utterance_save 암호화 구현
-
음성 언어 식별 모델 평가 및 VAD 개발 계획
-
일본어 개발계 배포 준비 및 장애 대응
-
일본어 ASR 파이프라인 설정 및 실험 기록
-
PVI 최적화 및 일본어 ASR 모델 개선 현황 (2026-05-06)
-
PVI 성능 최적화 및 일본어 ASR 모델 개선 현황
-
2026-04-22 업무: PVI, 일본어 ASR 개선 및 Silero VAD 평가
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-06)
-
2026-01-27 업무: 제로원 TTS, 일본어 ASR 개선, 두나무 유지보수
-
RTZR 일본어 STT 개발 이력 및 모델 레지스트리 구조
-
2025-11-05 업무: 오뚜기 모델 평가 및 L40S Whisper 일본어 성능 검증
-
2025-10-13 업무: 일본어 STT 모델 검증 및 제로원 제안서 초안
-
일본어 주소 인식 모델 배포 및 MWW STT 성능 검증
-
Day 1055: 전사 품질 필터링 및 Triton E2E 디코딩 오류 분석
-
Day 5. 2021-07-05
-
Day 40. 2021-08-09
-
Day 27. 2021-07-27
-
Day 21. 2021-07-21
-
Day 20. 2021-07-20
-
Day 166. 2021-12-13
-
Day 160. 2021-12-07
-
MWW EKS 환경 접속 및 배포 준비 (Day 1153)
-
일본어 데이터 전처리 및 정제 규칙 (Day 790)
-
Day 203: Sommers Dataset Testing & Detokenization Issues
-
Day 1042 작업 기록: 데이터셋, MWW 버그, 인프라
-
MWW 한국어 개발계 배포 및 기술적 장애 대응 (2023-11-15)
-
Triton Server 헬름 차트 배포 및 모델 로딩 오류
-
주소 모델 개발 현황
-
PVI 및 일본어 ASR 모델 개선 현황 (2026-05-22)
-
ASR 모델 개선 현황: PVI, 일본어, MWW 화물맨
-
Primary Voice Isolation(PVI) 평가 환경 구축 및 신한 SDK 16kHz 대응
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-04)
-
TTS 모델 개선 및 S2 리빌드 진행
-
현대캐피탈 Numberplate 모델 장애 진단 및 일본어 T4 모델 준비
-
일본어 STT 모델 벤치마킹 및 인프라 작업 기록 (2025-01-14)
-
전처리 이슈
-
ReturnZero Day 79: 인프라 설정 복구 시도 및 일감 데이터 쿼리
-
Day 238. 2022-02-23
-
CD 및 Transcriber 최적화 진행 상황
-
Kiwi 형태소 분석기 모델 학습 및 N-gram 언어모델 이론 정리
-
WFST 코드 보완 및 분류 모델 성능 평가 (Day 400)
-
RL 모델 서빙 고민
-
일본어 숫자 및 날짜 처리 로직 개선 (Day 533)
-
Day 950: PTQ 세미나 및 작업 진행 상황
-
프로나이아 프로젝트 및 인프라 운영 일지 (Day 1287)
-
하코네 여행 경비 및 일본어 학습
-
MWW 배포 회고 및 테스트 데이터셋 구성 전략
-
주소 인식 모델 성능 검증 및 Triton 배포 전략
-
일본어 ASR 모델 평가 및 rt-itn 배포 기록
-
일본어 ASR 파인튜닝 준비 및 코드 수정
-
dadumi 버그 수정 및 Pronaia API 구조 분석
-
프로나이아 모델 배포 및 스마트 어터런스 처리 로직 설계
-
ASR 방향성 회의 및 3i4k 환경 구축 삽질
-
PVI 모델 개선 및 일본어 ASR 이슈 분석
-
Primary Voice Isolation(PVI) 및 신한은행 다국어 ASR 대응 현황
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-02-27)
-
TTS 모델 개선 및 S2 리빌드
-
2026-01-20 업무: 제로원 TTS 데이터 정제 및 일본어 STT 모델 배포 가이드
-
2025-09-16 일본어 모델 배포 및 설정 작업
-
Day 1380. 2025-04-10 - 업무
-
Engine 코드 수정 및 검증 (2024-12-27)
-
2024-12-03 작업 일지: 시스템 튜닝 및 배포
-
ASR 전사 결과 평가용 프롬프트 영문화 및 간소화
-
일본어 NLP 파이프라인 디버깅 및 코퍼스 구축
-
Day 35. 2021-08-04
-
Day 34. 2021-08-03
-
rt-gec 토크나이저 이슈 및 일본어 ITN 학습 데이터 가이드라인
-
ReturnZero Day 1134: 에어갭 환경 구축 및 MWW 오류 대응
-
Day 106: 지급형 쿠폰 기능 개발 및 알고리즘 학습
-
Day 957: 주소모델 실험 및 Kubernetes GPU 환경 설정
-
BMT Pronaia VAD 오류 해결 및 seq2seq 학습 기록
-
학습 파이프라인 개선
-
ITN-JP 숫자 변환 및 테스트셋 구축 (Day 535)
-
일본어 이름 모델 검증 및 T4 배포 준비
-
워커 3단 배포 전략 및 차트 개발 현황
-
Callabo STT 성능 개선 및 일본어 Qoo10 데이터 얼라인 전략
-
GEC 모델 ONNX 변환 및 NLP4STT 진행 상황
-
2026-05-28 업무 및 기술 이슈 요약
-
한국어 TTS 정규화 모델 개발 및 일본어 ASR 개선 현황
-
2026-01-15 업무 및 일본어 ASR 개선 계획
-
SIMS 모델 배포 및 게이트웨이 설정 작업
-
VAD Dynamic Length 및 E2E ASR Config 변경 사항
-
Stock Trader 데이터 준비 및 아키텍처 검토
-
팀벨 개발 환경 설정 및 SIMS 배포 준비 (Day 959)
-
현대캐피탈 고도화 및 일본어 모델 개발 진행 상황 (Day 1524)
-
ReturnZero Day 1343: 차트 리팩토링 및 온프렘 설치 스크립트 점검
-
RL 트레이딩 전략 학습 및 검증 과정 (2024-05-02)
-
mww 운영계 배포 아키텍처 및 구성 요소
-
PRONAIA BMT 서비스 배포 및 테스트 데이터 준비 현황
-
STT 성능 벤치마킹 및 특허 기술 아이디어 정리
-
Pronaia-Engine 코드 폴리싱 및 Triton Mel 성능 검증
-
일본어 NLP 파이프라인 및 데이터셋 전처리 작업 기록
-
제한 테스트
-
Neural-ITN TensorRT 배포 시도 및 한계
-
Triton Ensemble 구현 및 NLP4STT 띄어쓰기 이슈
-
2022-12-26 회사 근황 및 NLP 기술 검토
-
TTS 연구 파이프라인 정의 및 Project-K 협업 회고
-
화물맨 ASR 도메인 특화 및 일본어 모델 개선 현황
-
Primary Voice Isolation(PVI) 및 신한은행 다국어 STT 대응 현황
-
2026-02-26 업무 일지: 일본어 ASR 개선 및 S2 리빌드
-
TTS 개선 및 S2 리빌드
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
2026-02-02 업무: 일본어 ASR 모델 개선 및 제로원 데이터 처리
-
2026-01-22 업무 및 모델 개선 이슈
-
2025-09-23 업무: 일본어 배포 및 서울소방 로그 분석
-
일본어 Cutoff 모델 배포 준비 및 Partial 응답 속도 검증
-
Triton-Kaldi Offline Decoder 리팩토링 및 TTS 학습 진행 상황 (Day 259)
-
Kiwi 형태소 분석기 모델 학습 및 데이터 변환 프로세스
-
ReturnZero Day 1653: Speech Stack 개선 및 타운홀 전략 회고
-
SIMS 환경 설정 및 최적화 (Day 1202)
-
K8s 이슈)
-
Day 851: 팀벨 미팅 및 현대캐피탈 운영 이슈
-
일본어 철자전사 Align 및 신한은행 프로젝트 Kickoff
-
Homura-Dan 라이센스 서버 아키텍처 및 RTFx 성능 벤치마크
-
NLP 문제 정의
-
ITN 서비스 배포 및 VAD 통합 구성 검토
-
ITN 성능 벤치마크 및 토큰화 버그 분석
-
2023-03-23 작업 기록: 일본어 ITN 및 Qoo10 ASR 정렬
-
ITN 모델 최적화 및 데이터 전처리 작업 기록
-
ASR 모델 개선 및 프로젝트 진행 현황 (2026-05-07)
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
2026-01-29 업무: 일본어 ASR 모델 개선 및 제로원 데이터 이슈
-
2026-01-28 업무: 일본어 ASR 모델 개선 및 데이터셋 구축
-
2026-01-19 업무: 제로원 TTS 데이터 파이프라인 및 일본어 ASR 모델 개선
-
RTZR 일본어 ASR 개발 이력 및 모델 레지스트리 구조
-
기가코리아 개발 회의
-
STT-LLM-TTS 챗봇 기술 스택 및 설정 초안
-
Day 937: 다드미 버그 수정, 일본어 데이터 수집, 특허 보완
-
Day 1590. 2025-11-06 - 업무 진행 상황
-
Day 964: SIMS Helm 차트 수정 및 인프라 설정 작업
-
ITN 파이프라인 통합 및 일본어 정규화 작업 현황 (Day 602)
-
ReturnZero STT 서비스 K8s 배포 및 Triton Server 연동 작업 (Day 748)
-
2024-04-17 일기: RL 학습 및 시스템 최적화 노트
-
현대캐피탈 고도화: SIMS 배포 및 환경 설정 (Day 1465)
-
일본어 TTS 데이터 전처리 및 학습 구성안
-
WFST 규칙 최적화 및 성능 평가 (Day 404)
-
Greedy Confidence 및 Entropy 기반 신뢰도 추론 아키텍처
-
MWW VAD 임계값 수정 및 테스트
-
한국어 배포 준비
-
일본어 Neural ITN 및 4090 환경 빌드 시도
-
fp16 테스트 실패 및 배포 작업 기록
-
NLP4STT 프로젝트 마무리 및 팀원 이탈 회고
-
일본어 STT 이슈
-
STT 관련 고찰
-
3i4k VTS 데이터 전처리 및 BMT 음성 전사 이슈
-
2022-05-18 일일 작업 기록: 서베이 및 배포 프로세스 개선 논의
-
Triton-Kaldi ASR 파이프라인 개선 및 스트레스 테스트 계획
-
2026-05-14 업무 및 기술 이슈 요약
-
Primary Voice Isolation(PVI) 및 일본어 ASR 개선 현황
-
2026-03-25 업무 및 기술 이슈 요약
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 계획
-
한국어 TTS 텍스트 정규화(TN) 경량 모델 개발 진행 상황 (2026-02)
-
2026-02-08 업무: 일본어 ASR 모델 개선 및 웰컴 프로젝트 인프라 구축
-
2026-01-30 업무: 일본어 ASR 개선, 제로원 데이터 처리, 두나무 인프라 이슈
-
2026-01-26 업무: 제로원 준비 및 일본어 ASR 개선
-
2026-01-14 업무 및 일본어 모델 배포 준비
-
2025-10-14 업무: 일본어 STT 튜닝 실험 및 제로원 제안서 초안
-
2024-11-27 작업 기록: 일본어 BMT 실험 및 Pronaia 서버 리팩토링
-
일본어 STT 모델 튜닝 및 팀벨 서비스 장애 대응
-
Whisper 인프라 개선, 브라우저 DNN 탐색
-
FastAPI 학습
-
Prometheus 모니터링 이슈
-
SIMS 고도화 및 K8s 환경 구축 작업 기록 (Day 1492)
-
Day 852: 현대캐피탈 방문 및 use_vad_event 배포 준비
-
Day 58 (2021-08-27): 벨 프로젝트 인수 및 EFS 장애 대응
-
rt-highlighter 배포 및 프로젝트 진행 상황 (Day 502)
-
SIMS 헬름 구성 및 파이프라인 자동화 고민
-
dadumi한테 어떻게 task를 줄건데
-
일본어 NLP 화이트리스트 및 배포 기록
-
Triton 서비스 확장 및 Helm Chart 문제
-
2023-07-27 작업 계획: 일본어 모델 배포 및 Triton 설정
-
Qoo10 rtboost 구현 및 dadumi aligner 알고리즘 설계 고민
-
2023-02-24 작업 기록: 일본어 STT 조사 및 통합 ITN 설계
-
Total ensemble model
-
Triton Inference Server 앙상블 배치 처리 검증
-
프로젝트 Bled 중단 및 SAC 프로젝트 집중
-
Pysommers BMT CER 계산 및 화자 구분 세미나 노트
-
삼성 마지막 날: GRPC 서버 개발 및 TTS 요구사항 정의
-
Primary Voice Isolation (PVI) 파이프라인 개선 및 일본어 ASR 모델 이슈
-
S2 리빌드 및 스택빌더 개발 현황 (2026-02-28)
-
TTS 모델 개선 및 S2 리빌드 진행 상황
-
2026-01-21 업무: 제로원 TTS 데이터 정제 실패 및 일본어 STT 모델 개선 계획
-
현대캐피탈 고도화 이슈 대응 및 utterance_save 암호화 구현
-
2025-01-17 업무: 일본어 STT 벤치마크 및 VAD 튜닝
-
팩맨TF 및 dadumi-worker 아키텍처 리팩토링 고려사항
-
2024-11-29 업무 기록: 일본어 모델 개선 및 PII 버그 수정
-
기능 개발 진행
-
프로젝트 현황 (Day 36)
-
Day 205: 오프라인 디코더 비교 실험 및 화자분리 장애 대응
-
Kaldi Feature Pipeline 및 iVector 추출 탐색 (Day 272)
-
WFST 인터페이스 및 파인튜닝 진행 상황 (Day 383)
-
ReturnZero 프로젝트 관련 기술 링크 모음
-
2023 년 1 월~12 월 업무 회고 및 일본어 ITN 개발 이력
-
일본어 Pronaia 배포 및 ITN 파이프라인 실험
-
NLU 기술 동향 및 전시회 메모
-
qoo10 일본어 서버 재가동 및 헬름차트 설정
-
통합 ITN 및 S2 Phase 1 진행 상황 (2023-06-05)
-
T4 빌드 및 일본어 NLP 처리 방안
-
ITN 성능 병목 분석 및 일본어 전사 개선 방향
-
업라이즈 AI바우처: 금융 콘텐츠 요약 서비스 및 NLP4STT 기술적 장애물
-
ASR-ITN 파이프라인 최적화 및 재학습 전략 논의
-
ITN 이슈: CTM 정보 복구
-
ASR 모델 개선 현황: PVI, 일본어, 화물맨 도메인
-
다국어 RTFx 성능 측정 및 S2 리빌드 현황
-
S2 리빌드 및 다국어 RTFx 측정 (2026-03-11)
-
2026-01-16 업무: 두나무 STT 연동 장애 및 일본어 모델 개선
-
2026-01-02 업무 및 제로원 TTS TN 프로젝트 킥오프
-
ReturnZero STT 솔루션 개발 및 모델 레지스트리 구조화
-
MWW-TMN 배포 및 인프라 문제 해결 (2025-10-21)
-
Pronaia Multilang 배포 디버깅 및 utterance_save 암호화 구현
-
프로나이아(Pronaia) 전사 요약 기능 개발 및 Kubespray 정리
-
dadumi lang 포함
-
스케줄링 이슈
-
MWW 일본어 주소 모델 성능 개선 및 WFS 문제 진단
-
팀벨 프로젝트: 개인정보 필터링 및 서버 구축 작업
-
Day 553: 띄어쓰기 벤치마크 설계 및 Pronaia Engine 아키텍처 분석
-
ASR), 인프라 혼돈
-
2021-07-02 개발팀 워크샵 (Day 2)
-
Kubernetes 클러스터 보안 점검 및 Day 1199 업무 기록
-
ReturnZero 리서치 프로젝트 현황 (2022-01)
-
Pronaia Online 서비스 운영 및 리소스 모니터링
-
BMT 모델 테스트 및 인프라 설정 (2024-01-05)
-
ITN 배포용 메트릭 설정 및 K8s 테스트베드 구축
-
출장 정리 및 이름 모델 개선 계획 (2023-11-14)
-
미래에셋 방문 및 일본어 데이터 준비 작업
-
일본어 데이터셋 전환 및 Quota 서비스 로직 수정
-
2023-07-05 작업 계획 및 MWW 연동 이슈 해결
-
프로나이아(Pronaia) 일본 배포 및 API 접근 제어 아키텍처 논의
-
NLP4STT: ITN 및 띄어쓰기 후처리 개선
-
NeuralITN TRT 변환 성공 및 Triton 포팅 과정
-
2023-01-05 일지: pysommers 배포 문제 해결, NLP4STT 띄어쓰기 모델 최적화 및 사업계획
-
일본어 ITN 포팅 착수 및 띄어쓰기 복원 알고리즘 고민