대규모 한국어 말뭉치(700만 건) 처리 및 Kiwi 형태소 분석기 모델 학습 실험 진행 중. 기존 형태소와 Kiwi 형태소의 카운팅 결과 유사성을 확인하고, 나무위키 데이터 추가 학습을 시도했으나 처리 시간이 길어짐. 일본어 NLP 파서 코드 정리를 위해 숫자(number), 날짜(date), 단위(unit) 등의 정규화 로직을 한국어에서 일본어(한자/가나)로 마이그레이션하며, 일본어 특유의 숫자 발음 규칙(예: 나이 표현, 분수)과 예외 처리에 대한 검토 필요성을 확인함.
-
ReturnZero Day 532: Kiwi 모델 검증 및 일본어 숫자 태깅 규칙 분석
-
일본어 NLP 파이프라인 디버깅 및 코퍼스 구축
-
일본어 숫자 및 날짜 처리 로직 개선 (Day 533)
-
Day 610: 태스크 정리 (NLP4STT, 다듬이, 일본어 데이터)
-
Day 516. 2022-11-28: Kiwi 모델 구축 API 화 및 콜라보 하이라이터 프로토타이핑
-
Kiwi 형태소 분석기 모델 학습 및 데이터 변환 프로세스
-
Kiwi NLP 모델 빌딩 및 데이터 전처리 작업 기록
-
Kiwi 형태소 분석기 학습 데이터 확보 및 일본어 ITN 개발 현황
-
Day 536. 2022-12-18
-
Day 497. 2022-11-09
-
Day 901. 2023-12-18
-
Day 448. 2022-09-21
-
Day 820. 2023-09-28
-
Day 1105. 2024-07-10
-
Day 589. 2023-02-09
-
Day 693. 2023-05-24
-
Day 530. 2022-12-12
-
Day 329. 2022-05-25
-
Day 366. 2022-07-01
-
Day 30. 2021-07-30
-
Day 21. 2021-07-21
-
Day 461. 2022-10-04
-
Day 238. 2022-02-23
-
Day 264. 2022-03-21
-
Day 471. 2022-10-14
-
ITN-JP 숫자 변환 및 테스트셋 구축 (Day 535)
-
Day 875. 2023-11-23
-
Day 27. 2021-07-27
-
Day 8. 2021-07-08
-
Day 9. 2021-07-09
-
Day 176. 2021-12-23
-
Day 177. 2021-12-24
-
Day 301. 2022-04-27
-
Day 6. 2021-07-06
-
Day 844. 2023-10-23
-
Day 14. 2021-07-14
-
Day 323. 2022-05-19
-
Day 15. 2021-07-15
-
Day 166. 2021-12-13
-
Day 490. 2022-11-02
-
Day 239. 2022-02-24
-
Day 187. 2022-01-03
-
Day 254. 2022-03-11
-
Day 364. 2022-06-29
-
Day 931. 2024-01-18
-
오전 업무 스몰토크 (Day 597)
-
Day 1. 2021-07-01
-
Day 19. 2021-07-19
-
Day 335. 2022-05-31
-
Day 160. 2021-12-07
-
Day 966. 2024-02-22
-
Day 35. 2021-08-04
-
Day 212. 2022-01-28
-
Day 40. 2021-08-09
-
Day 247. 2022-03-04
-
Day 356. 2022-06-21
-
Day 61 (2021-08-30) - ReturnZero 일지
-
Day 1106. 2024-07-11 업무 요약
-
Day 369. 2022-07-04
-
Day 372 (2022-07-07) 작업 기록
-
Day 428. 2022-09-01
-
Day 455. 2022-09-28
-
Day 315. 2022-05-11
-
Day 331. 2022-05-27
-
Day 285. 2022-04-11
-
Day 995. 2024-03-22
-
Day 34. 2021-08-03
-
Day 5. 2021-07-05
-
Day 20. 2021-07-20
-
Day 1426. 2025-05-26 - 업무
-
다듬이 (Day 663)
-
Day 1022 (2024-04-18) - ReturnZero Daily Note
-
새 일본어 고객 (Day 786)
-
Day 1104 (2024-07-09) - ReturnZero Daily Note
-
ReturnZero Day 640: 텍스트 처리 파이프라인 리팩토링 및 세그멘테이션 이슈
-
다듬이 및 일본어 모델 처리 논의 (Day 642)
-
다듬이 마무리 (Day 702)
-
ReturnZero 일본어 배포 및 문서 수정 (Day 1545)
-
ReturnZero Day 1058: ASR 파이프라인 진행 상황 및 버그 수정
-
Day 1036: 상태 확인 및 기술적 장애물
-
긴 입력 처리 아키텍처 검토 (Day 586)
-
Vocab 실험 및 작업량 분석
-
ReturnZero Day 860: STT 모델 수정 및 성능 벤치마크
-
ReturnZero Day 686: 큐 병목 및 Worker 성능 저하 대응
-
ReturnZero Day 495: 화자 분리 실패와 룰 기반 FP 감수
-
ReturnZero Day 858: Confidence Score 적용 및 모델 변경
-
ReturnZero 분류 모델 성능 보정 실험 (Day 401)
-
ReturnZero Day 814: 일본어 모델 학습 속도 문제 및 해결
-
ReturnZero Day 1047: 일본어 ASR 모델 검증 및 성능 분석
-
Day 902: Audio Feature Extraction & Model Check
-
Day 365: VTS Trial 실험 결과 및 SAC 킥오프
-
ReturnZero Day 1147: AM 모델 학습 API 테스트
-
ReturnZero Day 1061: STT 엔지니어링 및 평가 현황
-
Day 588: 띄어쓰기 교정 실험 및 KAIST 채용 심사 기록
-
Day 303: 모델 이미지 재배포 및 TTS 연구 시작
-
ReturnZero Day 482: 비즈니스 통화 스크립트 검토 및 결과 비교 실험
-
Day 897: E2E 테스트, 데이터 증강 및 LM 적용 논의
-
ReturnZero Day 832: 일본어 인식 실험 및 Prefix Decoder 평가
-
ReturnZero Day 291: gRPC 로직 및 Ali-phone 정렬 디버깅
-
ReturnZero Day 903: 모델 최적화 시도 및 성능 벤치마크
-
ReturnZero Day 359: Python Client 완료 및 3i4k 데이터 FP 검증 시작
-
Conformer 모델 앙상블 및 BLS 통합 실험 (Day 910)
-
SetFit 제로샷 분류 실험 및 ReturnZero 현황 (Day 545)
-
ReturnZero Day 764: 헬름차트 변경 및 배치 처리 아키텍처 논의
-
ReturnZero Day 1643: 모델 레지스트리 구조화 및 전사 장애 분석
-
ReturnZero Day 1062: 워크샵 및 거대모델 대체 전략 논의
-
ReturnZero Day 488: 팀 기조 변경 및 NLP 전략 재정의
-
ReturnZero Day 476: Message Commitment & Townhall Notes
-
VITO 요약 회의 및 RoBERTa 의도 분석 모델 논의
-
ReturnZero Day 1118: 음성 인식 전사 오류 및 WFST 디코더 호환성 문제
-
Day 1043: PII Redaction Filter 개발 및 On-Prem 모델 관리
-
Project-K 지역락 이슈 및 모델 이미지 재퍼블리시
-
ReturnZero Day 958: 한자 인식 성능 평가 및 VAD 파라미터 튜닝
-
Confidence 구현
-
ReturnZero Day 1575: Series C 투자 유치 및 조직 위기 관리
-
ReturnZero 데이터셋 전처리 및 pysommers 파이프라인 디버깅
-
멀티뷰 학습 및 vLLM 서빙 엔진 탐색
-
CTC Align 실패 현상 및 대안 탐색 (Day 672)
-
BLS 구현 및 배포 준비 (Day 694)
-
일본어 데이터 전처리 및 정제 규칙 (Day 790)
-
Day 1125. 2024-07-30 - 업무
-
Day 800: 세팅 및 ITN 워커 스펙 변경
-
ITN 모델 배포 및 성능 튜닝 (Day 666)
-
일본어 데이터 전처리 및 ITN 방침 (Day 623)
-
Qoo10 일본어 ASR 파이프라인 및 엔진 성능 테스트 (Day 797)
-
ITN 파이프라인 통합 및 일본어 정규화 작업 현황 (Day 602)
-
Day 946: YouTube 데이터 파이프라인 실험 및 Worker 테스트 이슈
-
Day 847: Triton 테스트 환경 구축 및 특허 전략 논의
-
일본어 ASR 모델 실험 및 데이터 파이프라인 개선 (Day 811)
-
ITN 개발 및 에이전트 아키텍처 논의 (Day 680)
-
ReturnZero Day 594: 일본어 데이터 파이프라인 및 ITN 아키텍처 검토
-
Day 942: vito-worker 배포 및 STT 파이프라인 설정
-
Day 699: dadumi 배포 및 일본어 ASR 평가
-
Pronaia Engine 필터링 및 아키텍처 도식화 (Day 1044)
-
일본어 ASR 얼라인 및 ITN 파이프라인 개발 (Day 635)
-
ReturnZero Day 582: 워크플로우 연동 및 Triton 배포 계획
-
Python Client 초기 배포 및 구조 검토 (Day 358)
-
ITN 성능 시험 및 VAD 통합 테스트 진행 (Day 667)
-
Day 1380. 2025-04-10 - 업무
-
Day 665: ITN 모델 배포 장애 및 환경 정리
-
Day 390: 핵심성분 분석 및 WFST 테스트 진행
-
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
-
Triton 배포 및 모델 컴파일 파이프라인 정리 (Day 576)
-
일본어 데이터 정제 및 전처리 파이프라인 (Day 1562)
-
ReturnZero E2E 파이프라인 실행 순서 및 데이터 구조 분석
-
ASR 파싱 및 인프라 요구사항 (Day 791)
-
프로나이아 엔진 아키텍처 및 운영 이슈 (Day 715)
-
WFST 규칙 최적화 및 성능 평가 (Day 404)
-
2022-06-20 워크샵 및 모델 실험 기록
-
ReturnZero Day 837: 일본어 ASR 평가 및 엔진 개발
-
Day 1009: 팀벨 레이턴시 이슈 및 일본어 E2E 세그멘테이션
-
Day 491: E2E 음성 인식 서버 배포 장애 및 Kaldi 대체안 검토
-
일본어 STT 개발계 배포 및 벤치마크 실행 기록 (Day 872)
-
일본어 ASR 모델 성능 검증 및 디버깅 (Day 708)
-
Day 300: 도커 배포, ivector 디버깅, gRPC 타임아웃 이슈
-
ReturnZero 리빌딩 및 전략 회고 (Day 632)
-
리팩토링 시도: cdrewrite 및 transducer 기반 태그 삽입 성능 문제
-
ReturnZero Day 1756: PVI 및 일본어 ASR 개선 이슈
-
일본어 ASR 모델 훈련 성능 저하 관찰 (Day 1571)
-
WFST 코드 보완 및 분류 모델 성능 평가 (Day 400)
-
ReturnZero Day 1622: STT 파이프라인 개선 및 배포 인프라 작업
-
데이터 전략 논의 (Day 845)
-
BERT 모델의 ONNX 변환 및 Triton Server 배포 시도 (Day 559)
-
배포 워크플로우 논의 (Day 859)
-
Day 555: ONNX 모델 배포 및 환경 구성 고민
-
ReturnZero Day 1785: PVI, 일본어 ASR 개선 및 MWW 배포
-
ReturnZero Day 1765: PVI 및 일본어 ASR 모델 개선 현황
-
Day 727: vitoworker 테스트 복구 및 PoC 준비
-
Day 385 (2022-07-20): WFST 개발 및 휴가 잔여일 계산
-
ReturnZero Day 700: 샌박 테스트 결과 및 일본어 STT 프로젝트 현황
-
Day 904: STT 학습 기능 논의 및 배포 준비 (2023-12-21)
-
ReturnZero Day 1749: PVI 및 일본어 ASR 개선 작업
-
Torch 의존성 제거 및 Triton 이미지 배포 작업 (Day 658)
-
Day 657: Vito Worker 배포 및 rt-neural-itn Torch 의존성 제거
-
Day 203: Sommers Dataset Testing & Detokenization Issues
-
일본어 ASR 모델 디버깅 및 성능 비교 (Day 704)
-
ReturnZero Day 1794: PVI 및 일본어 ASR 개선 현황
-
Day 1015: 음성 전처리 교정 및 LLM 임베딩 학습
-
NLP 모델 오류 패턴 분석 및 개선 방안 (2022-10-28)
-
MWW EKS 배포 장애 및 STT 모델 평가 이슈 (Day 1168)
-
ReturnZero Day 1748: PVI 및 일본어 ASR 개선 작업
-
일본어 ASR 프로젝트 현황 및 전략 논의 (Day 627)
-
T4 GPU 환경에서 WFST 모델의 성능 측정 (Day 876)
-
WFST 테스트 코드 및 규칙 개발 (Day 391)
-
Day 937: 다드미 버그 수정, 일본어 데이터 수집, 특허 보완
-
ReturnZero Day 1743: PVI, 일본어 ASR 개선 및 신한 SDK 빌드
-
MLOps 인프라 및 데이터 과학 공정 현황 (Day 251)
-
ReturnZero Day 1736: PVI 및 일본어 ASR 개선 현황
-
일본어 STT 모델 배포 준비 및 성능 평가 (Day 838)
-
ReturnZero Day 1645: 모델 레지스트리 및 웰컴용 STT 패키징 진행
-
KISA 프로젝트 준비 및 일본어 STT 모델 실험 (Day 1570)
-
2021-07-02 개발팀 워크샵 (Day 2)
-
ReturnZero Day 1651: 업무 현황 및 제로원 TTS TN 정책 정의
-
ReturnZero Day 1489: utterance 암호화 구현 및 Next Model(일본어) 탐색
-
일본어 프로젝트 진행 상황
-
ReturnZero Day 1762: PVI 및 일본어 ASR 개선 현황
-
현대캐피탈 Triton 서버 빌드 및 성능 벤치마크 (Day 1112)
-
일본어 ASR 이슈 및 UBase 타운홀 요약
-
gRPC 연동 및 GoP 디버깅 (Day 290)
-
Day 1042 작업 기록: 데이터셋, MWW 버그, 인프라
-
3i4k 모델 성능 저하 분석 및 Pronaia 클라이언트 개발 현황
-
ReturnZero Day 1644: 모델 레지스트리 구축 및 웰컴용 STT 패키징
-
ReturnZero Day 1625: 웰컴용 Translator 패키징 및 일본어 모델 개선
-
WFST 인터페이스 및 파인튜닝 진행 상황 (Day 383)
-
Dadumi 배포 및 샌드박스 테스트 진행 상황 (Day 695)
-
Day 306: GoP Decoder 문서화 및 Triton Backend 연구
-
ITN 개선 및 제로원 착수 준비
-
ReturnZero Day 1745: PVI, 일본어 ASR 개선 및 Kubernetes 보안 검토
-
신한카드 RFI 대응 및 STT 엔진 개발 현황 (Day 1034)
-
Triton-Kaldi 보고 및 CER 준비 (Day 236)
-
Day 950: PTQ 세미나 및 작업 진행 상황
-
GOP 프로젝트: ivector 문제 탐색 및 도커 배포 준비 (Day 299)
-
ReturnZero Day 1650: 업무 현황 및 제로원 TTS TN 설계 초안
-
ReturnZero Day 1653: Speech Stack 개선 및 타운홀 전략 회고
-
SIMS 환경 설정 및 최적화 (Day 1202)
-
프로나이아 프로젝트 및 인프라 운영 일지 (Day 1287)
-
E2E ASR 모델 Triton 서빙 환경 구축 및 테스트 (Day 723)
-
ReturnZero: WFSTClassifier 리팩토링 및 명명 규칙 정리
-
Day 1314 (2025-02-03) - 업무 및 조직 개편
-
Pronaia STT 환경 설정 및 특허 미팅 기록 (Day 917)
-
ReturnZero Day 1623: STT 파이프라인 개선 및 인프라 자동화
-
Day 1143: 업무 및 기술적 문제 해결 기록
-
Day 1055: 전사 품질 필터링 및 Triton E2E 디코딩 오류 분석
-
MWW EKS 환경 접속 및 배포 준비 (Day 1153)
-
CD 및 Transcriber 최적화 진행 상황
-
K8s 이슈)
-
GOP 디코더 디버깅 및 배포 일정 (Day 296)
-
Day 750: Helm Chart, Pronaia Proxy Logic, and Docker Build Tasks
-
Day 1590. 2025-11-06 - 업무 진행 상황
-
Day 282. 2022-04-08: GRPC 컴파일 시도 및 GoPRequest 파이프라인 설계
-
테스트 진행 상황 (Day 965)
-
Day 553: 띄어쓰기 벤치마크 설계 및 Pronaia Engine 아키텍처 분석
-
Day 181: 배포 장애 대응 및 Triton 서버 학습 계획
-
Day 253: Vito-kaldi 리팩토링 및 Triton-kaldi 반영
-
Day 851: 팀벨 미팅 및 현대캐피탈 운영 이슈
-
GOP Online Decoder 테스트 및 디버깅 (Day 286)
-
ReturnZero Day 79: 인프라 설정 복구 시도 및 일감 데이터 쿼리
-
차트 개편
-
FST 기반 분류기 구조 및 코드 리팩토링 (Day 435)
-
Day 964: SIMS Helm 차트 수정 및 인프라 설정 작업
-
ReturnZero Day 1134: 에어갭 환경 구축 및 MWW 오류 대응
-
Day 852: 현대캐피탈 방문 및 use_vad_event 배포 준비
-
WFST 엔진 구현 및 Commitment 작업 (Day 392)
-
Kubernetes 클러스터 보안 점검 및 Day 1199 업무 기록
-
신한카드 개발 환경 구축 및 문제점 (Day 1198)
-
화행 분석을 위한 한국어 형태소 분석기 평가 및 규칙 기반 접근의 한계
-
팀벨 개발 환경 설정 및 SIMS 배포 준비 (Day 959)
-
라벨링 가이드라인 및 카테고리 정의 (Day 478)
-
쿠폰함 개발 및 기획 변경 (Day 161)
-
AICT 문장 띄어쓰기 벤치마크 및 워커 컨테이너 테스트
-
Kiwi 모델 빌더 세그먼트 폴트 디버깅 및 ITN 초기 조사
-
ReturnZero Day 1500: 현대캐피탈 고도화 및 utterance_save 암호화 구현
-
Day 137: Rails JSON Serialization Issue
-
Day 425: 환경 설정 문제 및 하이라이터 프로젝트 방향성
-
GoP 계산 파이프라인 분석 및 구현 계획 (Day 275)
-
ReturnZero 모델 레지스트리 구조화 및 업무 현황 (Day 1633)
-
KISA STT 솔루션 설치 및 환경 구성 (Day 1573)
-
Day 58 (2021-08-27): 벨 프로젝트 인수 및 EFS 장애 대응
-
rt-highlighter 배포 및 프로젝트 진행 상황 (Day 502)
-
ReturnZero Day 124: 쿠폰함 구현 및 기획 변경
-
Recall) 이해 및 HuggingFace Transformers 학습 코드 분석
-
3i4k 모델 검증 및 VTS 테스트셋 평가 전략
-
2024-11-28 업무 및 실험 기록
-
Stock Trader 데이터 준비 및 아키텍처 검토
-
쿠폰함 서비스 상태 관리 및 로직 개선 (Day 128)
-
쿠폰 시스템 리팩토링 및 마이그레이션 (Day 174)
-
Day 168: 쿠폰함 작업 및 구조 변경 대기
-
쿠폰함 페어코딩 및 테스트 코드 작성 (Day 162)
-
두나무 업무 및 차트 리팩토링 계획 (Day 1338)
-
Sims 설치 패키지 및 인프라 구성 정리 (Day 1185)
-
Day 117 (2021-10-25) - S-72 데이터 처리 및 쿠폰함 구현
-
다듬이: 텍스트 처리 파이프라인 성능 최적화 및 병렬화 실험
-
SIMS 고도화 및 K8s 환경 구축 작업 기록 (Day 1492)
-
GOP 계산 오류 디버깅 및 gRPC 서버 테스트 (Day 292)
-
Day 265: Vito-Kaldi 디코더 구조 분석 및 오프라인 디코딩 미완료
-
쿠폰함 구현 및 GoodProperties 설계 논의 (Day 134)
-
Day 126: 쿠폰 기능 개발 및 테스트 디버깅
-
mel2vec 영숫자 인식 성능 검증 및 패딩 실험 결과
-
일본어 Neural ITN 및 4090 환경 빌드 시도
-
ITN 성능 벤치마크 및 토큰화 버그 분석
-
ITN 성능 병목 분석 및 일본어 전사 개선 방향
-
2022-12-13 작업 기록: NLP 파이프라인 디버깅 및 일본어 ITN 통합
-
WFST 엔진 개발 및 토큰 태그 삽입 로직 개선 (Day 399)
-
Kaldi Feature Pipeline 및 iVector 추출 탐색 (Day 272)
-
Triton-Kaldi 통합 및 Kaldi 레시피 구조 분석 (Day 190)
-
현대캐피탈 고도화: SIMS 배포 및 환경 설정 (Day 1465)
-
ReturnZero Day 141: 쿠폰 기능 개발 및 버그 디버깅
-
두나무 인프라 구축 및 환경 설정 작업 (Day 1329)
-
Day 104: 쿠폰함 설계 및 AWS 로그 중복 문제
-
기능 개발 진행
-
Day 250: Rescore 구현 완료 및 Triton-Kaldi 환경 구축 삽질
-
현대캐피탈 고도화 및 일본어 모델 개발 진행 상황 (Day 1524)
-
Day 43: BoJ 5588 디버깅 및 vito-admin 개발
-
ReturnZero Day 173: 테스트 전략 및 쿠폰함 작업
-
쿠폰함 구현 및 DB 스키마 마이그레이션 (Day 167)
-
Day 159: 쿠폰함 리뷰 및 서버 이슈 대응 (2021-12-06)
-
Day 121: 쿠폰함 구현 및 데드락 이슈 대응
-
NLP4STT: ITN 및 띄어쓰기 후처리 개선
-
NLP4STT 점검: ITN, TER 메트릭 및 테스트셋 구축
-
gip-decoder 배포 및 TTS 아키텍처 검토
-
Triton Kaldi 메모리 누수 및 성능 저하 문제 분석 (Day 229)
-
일본어 데이터셋 구축 및 전사 파이프라인 디버깅
-
Day 957: 주소모델 실험 및 Kubernetes GPU 환경 설정
-
Day 153: Jenkins 빌드 스크립트 계획 및 편두통 휴가
-
팩맨 프로젝트 인프라 및 배치 작업 현황 (Day 1316)
-
Day 112: AWS Cost Data Ingestion & Coupon System
-
운영 이슈
-
ReturnZero STT 서비스 K8s 배포 및 Triton Server 연동 작업 (Day 748)
-
Prometheus 모니터링 이슈
-
Day 89: 데드락 해결 및 수지바오 로직 수정
-
쿠폰함 설계 및 AWS 아키텍처 검토 (Day 111)
-
ITN 배포용 메트릭 설정 및 K8s 테스트베드 구축
-
다듬이: 일본어 ITN 및 배포 준비
-
ITN 모델 최적화 및 데이터 전처리 작업 기록
-
2023-02-24 작업 기록: 일본어 STT 조사 및 통합 ITN 설계
-
NLP4STT: Neural ITN Triton화 및 배치 처리
-
일본어 ITN(숫자 읽기) 디버깅 및 워커 개발
-
ITN 규칙 대응 및 Kiwi 기반 NLP 파이프라인 개선
-
TMN 회의: 일본어 4자리 숫자 인식 오류 분석
-
Day 175: 쿠폰함 테스트 페어코딩 및 어드민 기능 확장
-
쿠폰함 모델 리팩터링 및 DB 설계 결정 (Day 169)
-
ReturnZero Day 1226: 차트 보완 및 사내 타운홀 회고
-
ReturnZero Day 1442: Pacman 배포 전략 및 신한카드 개발계 오류
-
ReturnZero Day 1343: 차트 리팩토링 및 온프렘 설치 스크립트 점검
-
S-86 작업 및 배포 이슈
-
Day 119: 쿠폰함 구현 및 DB 호환성 논의
-
주소 인식 모델 (Address Model) 성능 분석 및 트러블슈팅
-
다듬이: 음성 텍스트 전처리 로직 개선
-
일본어 Pronaia 배포 및 ITN 파이프라인 실험
-
일본어 NLP 파이프라인 및 데이터셋 전처리 작업 기록
-
ITN 논의
-
일본어 처리 이슈
-
Callabo STT 성능 개선 및 일본어 Qoo10 데이터 얼라인 전략
-
Total ensemble model
-
Kiwi 형태소 분석기 모델 학습 및 N-gram 언어모델 이론 정리
-
ITN 이슈: CTM 정보 복구
-
Day 99: 쿠폰함 기능 확장 및 DB 설계 논의
-
Day 63 (2021-09-01): Vito Admin 수정 및 배포 환경 문제
-
어드민 개발 및 서버 접속 이슈
-
쿠폰함 서비스 개발 및 서버 코드 리팩토링 (Day 132)
-
Day 125: 쿠폰함 구현 및 DB 연결 문제 해결
-
Day 106: 지급형 쿠폰 기능 개발 및 알고리즘 학습
-
쿠폰 기능 확장 및 발급 로직 구현 (Day 105)
-
Day 56: Sync Logic, AWS Infra Refactoring & Team Ops
-
프로젝트 현황 (Day 36)
-
Day 205: 오프라인 디코더 비교 실험 및 화자분리 장애 대응
-
일본어 이름 모델 검증 및 T4 배포 준비
-
통합 ITN 및 S2 Phase 1 진행 상황 (2023-06-05)
-
ITN 수정 및 토크나이징 성능 최적화 고민
-
2023-05-12 일본어 모델 학습 및 얼라인, ITN 서비스화 진행 상황
-
일어 음성 처리 파이프라인 디버깅 및 ITN 수정
-
2023-03-23 작업 기록: 일본어 ITN 및 Qoo10 ASR 정렬
-
일본어 ITN 포팅 착수 및 띄어쓰기 복원 알고리즘 고민
-
Day 148: 쿠폰함 에러 처리 및 건강 이상 신호
-
코드 리뷰 진행
-
ReturnZero Day 7: 서버 환경 세팅 및 DB 스키마 논의
-
Day 57: Production Deployment & Scaling Issues (2021-08-26)
-
PRONAIA 엔진 ITN 파이프라인 오류 (FstOpError)
-
VAD 임계값이 이름 학습 모델 성능에 미치는 영향 실험
-
2023-08-08 작업 일지: 일본어 학습, MWW 배포, Dadumi
-
ITN 서비스 배포 및 VAD 통합 구성 검토
-
통합 ITN(다듬이) 아키텍처 및 프로젝트 현황
-
일본어 ITN 서비스 배포 및 테스트 진행 상황
-
Day 69: AWS 장애 대응 및 멀티리전 확장 준비
-
Day 16: 페어프로그래밍, SQL 실수 및 테스트 중심 개발
-
쿠폰함 구현 및 Factory 메소드 패턴 적용 (Day 135)
-
데드락 해결 및 서비스 이슈
-
ReturnZero Day 133: 쿠폰함 구현 및 보상(Reward) 구조 설계
-
인프라 이슈 (Day 1224)
-
알고리즘 학습
-
WFST 연구 및 화행 레이블링 회의 기록 (Day 370)
-
두나무 개인정보보호 및 업무 진행 상황 (Day 1356)
-
2023 년 1 월~12 월 업무 회고 및 일본어 ITN 개발 이력
-
단위별 Confidence 및 Entropy 계산 로직 정립
-
일본어 ITN 테스트 및 데이터 문제 확인
-
ITN Triton 통합 배포 및 스레드 풀 문제
-
NLP4STT: ITN 평가 메트릭 및 pysommers 의존성 고민
-
RL 모델 서빙 고민
-
삼성 마지막 날: GRPC 서버 개발 및 TTS 요구사항 정의
-
ReturnZero Day 147: 쿠폰함 개발 및 Go 에러 처리 패턴 고민
-
Parquet 오디오 데이터 추출 및 전처리 스크립트
-
S-72 데이터 복구 및 쿠폰 시스템 마이그레이션 (Day 118)
-
두나무 성능 테스트 및 리소스 최적화 (Day 1392)
-
일본어 음성 전사 파이프라인 설계 및 고려사항
-
한국어 모델 업데이트 및 ITN 테스트 환경 준비
-
다듬이: 단어 정렬 및 매핑 알고리즘 개선
-
업라이즈 AI바우처: 금융 콘텐츠 요약 서비스 및 NLP4STT 기술적 장애물
-
ITN 벤치마크 방법론 재고 및 키위(Kiwi) 형태소 분석 한계 분석
-
FastAPI 학습
-
Triton-Kaldi Offline Decoder 리팩토링 및 TTS 학습 진행 상황 (Day 259)
-
Day 155: 쿠폰함 재설계 결정 및 백준 알고리즘 고민
-
Day 131: 쿠폰함 개발 및 동의 현황 쿼리 디버깅
-
ReturnZero Day 628: 조직 개편 및 RTZR Rebuild #2 전략 회의
-
ReturnZero Day 427: SAC 로직 기획 및 Highlighter 구현 방향
-
쿠폰함 서버 개발 및 Go 디자인 패턴 적용 (Day 138)
-
배치 구조 분석
-
ASR), 인프라 혼돈
-
Day 78 (2021-09-16): S-52 마무리 및 Vito-admin 배포 계획
-
Day 33: S-41 완료 및 API 문서 도커화 논의
-
일본어 음성 인식(ASR) 전사 파이프라인 디버깅 및 경량화 시도
-
미래에셋 방문 및 일본어 데이터 준비 작업
-
일본어 관련 의심 단어 목록 및 정제 규칙
-
Triton Server 헬름 차트 배포 및 모델 로딩 오류
-
T4 빌드 및 일본어 NLP 처리 방안
-
일본어 ASR 파이프라인 구축 및 Forced Alignment 문제 해결 시도
-
일본어 STT 이슈
-
통합 ITN 인터페이스 통일 및 일본어 프로젝트 일정 조정
-
rt-gec 토크나이저 이슈 및 일본어 ITN 학습 데이터 가이드라인
-
ASR-ITN 파이프라인 최적화 및 재학습 전략 논의
-
선생님 외부화 및 Kiwi 형태소 분석기 커스터마이징
-
프로나이아 모델 배포 및 스마트 어터런스 처리 로직 설계
-
3i4k 데이터 정제 전략 및 SAC 프로젝트 아키텍처 정의
-
polyglot-ko 서빙 준비도
-
S-72 진행 및 백준 2667 문제 풀이
-
쿠폰함 기능 구현 및 DB 스키마 설계 (Day 163)
-
Day 90: Git 실수, 데드락 논의, Logstash Cron 구현
-
ReturnZero Day 1139: 개발 환경 구축 및 시스템 장애 대응
-
Day 72 (2021-09-10): 휴가 및 VA-589 작업, 세미나 준비
-
일본어 TMN 회의 및 팀벨 클러스터 작업
-
일본어 TTS 데이터 전처리 및 학습 구성안
-
ITN: 텍스트 토크나이징 및 인퍼런스 파이프라인 개선
-
Alignment 설명
-
다듬이: Turn 기반 처리 파이프라인 재설계 및 Pandas 인덱스 문제
-
일본어 ASR 파이프라인 설정 및 실험 기록
-
2022-12-26 회사 근황 및 NLP 기술 검토
-
일본어 ITN (Inverse Text Normalization) 처리 규칙 및 문제점
-
Korean Spacing Algorithm Bug: Merged Phrase Overlap
-
맞춤법 검사 자동화 봇 및 데이터 파싱 로직
-
프로나이아 패키지화 및 3i4k FP 검증
-
3i4k VTS 데이터 전처리 및 BMT 음성 전사 이슈
-
TTS 연구 파이프라인 정의 및 Project-K 협업 회고
-
일본어 데이터 전사 비교 및 정규화 로직 수정
-
2025-09-16 일본어 모델 배포 및 설정 작업
-
Day 37: S-48 API 개발 및 Swagger 연동 이슈
-
E164 마이그레이션 장애 및 멀티클러스터 리소스 이슈 (Day 188)
-
Day 107: 디스코드 봇 개발 장애 및 AWS 접근 문제
-
Day 145: 쿠폰함 디버깅, 코드 프리즈 및 트랜스크라이버 성능 분석
-
Day 86: 백준 알고리즘 풀이 및 S-105 데드락 문제 해결 시도
-
ASR 모델 성능 평가 결과 (2023-10-02)
-
일본어 철자전사 Align 및 신한은행 프로젝트 Kickoff
-
일본어 NLP 데이터 정제 및 운영 라이선스 발급
-
일본어 ASR 데이터 전처리 및 Pronaia 메시지 구조 정의
-
2023-03-04 작업 진행 사항 (NLP4STT, 일본어 데이터셋, rt-dadumi)
-
맞춤법 봇: 띄어쓰기 교정 로직 및 API 테스트
-
ReturnZero: 컴포짓 클래스 및 라벨링 규칙 설계 고민
-
Triton 이미지 교체 및 Pronaia Engine 배포 작업
-
일본어 주소 인식 모델 배포 및 MWW STT 성능 검증
-
가독성 개선
-
Day 41: VITO 비활성 사용자 분석 및 Serverless 도입 고민
-
Triton-Kaldi 통합 테스트 및 팅커벨 사전 기능 설계 (Day 231)
-
유튜브 자막 전사 데이터 손실 및 저장소 오류
-
일본어 qoo10 음성 전사 및 정렬 문제 해결 시도
-
다드미 배포 논의: Align 알고리즘 병목 및 버그 분석
-
NLP 팀 회의 및 다음 작업 아이템 (2022-05-12)
-
2026-05-21 업무: PVI 및 일본어 ASR 모델 개선 현황
-
2026-04-23 업무: PVI 및 일본어 ASR 개선
-
MWW 일본어 배포 및 가독성 평가 실험 (2024-07-24)
-
전처리 이슈
-
S-54 이슈 분석
-
Day 120: 쿠폰 시스템 리팩토링 및 알고리즘 문제 풀이
-
Kay의 소회: 리턴제로의 현재와 생존 전략
-
자동화, S-118 데이터 마이그레이션, 운영 이슈
-
Whisper Dadumi 대응 및 언어 정보 처리
-
일본어 ASR 모델 성능 벤치마크 및 문제점 (2023-09-25)
-
일본어 NLP 화이트리스트 및 배포 기록
-
qoo10 일본어 서버 재가동 및 헬름차트 설정
-
NeuralITN TRT 변환 성공 및 Triton 포팅 과정
-
Neural-ITN TensorRT 배포 시도 및 한계
-
맞춤법 데이터 구조 및 토크나이징 전략 논의
-
PVI 성능 최적화 및 일본어 ASR 모델 개선 현황
-
PVI 성능 개선 및 일본어 ASR 모델 이슈 분석
-
Primary Voice Isolation(PVI) 및 일본어 ASR 개선 현황
-
2025-10-16 업무: 일본어 STT 실험 및 KISA 프로젝트 준비
-
CD 삽질과 쿠폰함 어드민 구현 난관
-
dadumi lang 포함
-
2024-09-19 업무: 일본어 STT 모델 튜닝 및 Prefix Decoder 디버깅
-
일본어 코드모델 (파나소닉 모델명 인식)
-
ASR 전사 결과 평가용 프롬프트 영문화 및 간소화
-
음성 데이터 전사 및 변환 작업 현황 (2024-05-22)
-
Qwen 모델에 대한 JAILBREAK 프롬프트 시도
-
Day 92: S-72 적용, S-118 DB 에러 분석, 백준 16235 시뮬레이션 구현
-
주소 인식 모델 서빙 방식 결정: ONNX Dynamic vs TRT
-
2024-01-03 할 일: T4 변환 및 성능 평가
-
일본어 개발계 배포 준비 및 장애 대응
-
MWW 한국어 개발계 배포 및 기술적 장애 대응 (2023-11-15)
-
일본어 ASR 파인튜닝 준비 및 코드 수정
-
일본어 데이터셋 전환 및 Quota 서비스 로직 수정
-
워커 3단 배포 전략 및 차트 개발 현황
-
주소 교정 (Address Correction)
-
NLP 문제 정의
-
띄어쓰기 모델 변환 및 성능 테스트
-
IP 돌리기 및 Kiwi 한국어 띄어쓰기 규칙 분석
-
프로젝트 Bled 중단 및 SAC 프로젝트 집중
-
2026-05-28 업무 및 기술 이슈 요약
-
ASR 모델 개선 현황: PVI, 일본어, MWW 화물맨
-
PVI 최적화 및 일본어 ASR 모델 개선 현황 (2026-05-06)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-13)
-
S2 리빌드 문서화 및 다국어 RTFx 측정 환경 구축
-
2026-01-20 업무: 제로원 TTS 데이터 정제 및 일본어 STT 모델 배포 가이드
-
일본어 STT 모델 벤치마킹 및 인프라 작업 기록 (2025-01-14)