WFST(Weighted Finite State Transducer) 관련 이슈 정리 및 Q, R 규칙 초안 작성을 완료했다. 향후 구현 목표는 사이띄개 클로저, 딕셔너리({}), 옵셔널(()) 구문 처리이며, 특히 TSV 기반 딕셔너리 파일 읽기 및 중첩 괄호 구조(딕셔너리/옵셔널 내 중첩)에 대한 제약 조건과 에러 처리 방안을 논의하고 있다.
-
WFST 엔진 구현 및 토큰 파싱 로직 설계
-
WFST 목록화 및 의존성 구문 분석 탐색
-
WFST 엔진 구현 및 Commitment 작업 (Day 392)
-
WFST 인터페이스 및 파인튜닝 진행 상황 (Day 383)
-
GOP 개발 및 기술적 고민 (2022-07-13)
-
WFST 엔진 개발 및 토큰 태그 삽입 로직 개선 (Day 399)
-
WFST 테스트 코드 및 규칙 개발 (Day 391)
-
약속) 성능 분석 및 정제 전략
-
WFST 최적화 및 결정화 알고리즘 검토
-
Day 390: 핵심성분 분석 및 WFST 테스트 진행
-
Day 385 (2022-07-20): WFST 개발 및 휴가 잔여일 계산
-
어미 처리 실험
-
Highlighter 구조 및 패턴 감별 방식 고찰
-
WFST 코드 보완 및 분류 모델 성능 평가 (Day 400)
-
WFST 규칙 최적화 및 성능 평가 (Day 404)
-
WFST 분류기 및 복합 클래스 우선순위 처리
-
WFST 연구 및 화행 레이블링 회의 기록 (Day 370)
-
pynini 학습 노트
-
FST 기반 분류기 구조 및 코드 리팩토링 (Day 435)
-
WFST 어미 인식 개선 및 gop-decoder S3 연동 계획
-
Rule-based NER 및 Semantic Role Labeling 구현 전략
-
rt-itn-jp 코드 모델 및 WFST 구현 계획
-
스크립트 기반 자동 타이핑 기계 아이디어
-
ReturnZero: WFSTClassifier 리팩토링 및 명명 규칙 정리
-
대화 발화 병합 및 규칙 기반 분류 파이프라인 설계
-
Composite rule: 해시 검증의 한계와 조합 폭발 문제
-
Qoo10 rtboost 구현 및 dadumi aligner 알고리즘 설계 고민
-
리팩토링 요소
-
ReturnZero: 컴포짓 클래스 및 라벨링 규칙 설계 고민
-
수열 패턴 및 제곱근 근사 공식 탐구 (2019)
-
Fine-tuning 개념 정리
-
가치 있는 발화 추출의 어려움과 SAC 방향성 고민
-
NLP 라벨링 도구: 예측 및 비교 스크립트
-
라벨링 가이드라인 및 카테고리 정의 (Day 478)
-
Confidence 구현
-
미팅 요약 서베이 및 화행 분석
-
GOP(Kaldi) 구현 준비 및 GRPC 프로토콜 설계
-
오프로딩: 속도 할당 및 유틸리티 함수 설계
-
Hypernetwork 구조 분석 및 한계점
-
3i4k 데이터셋을 활용한 화행분류 Feasibility 검토
-
회의록 요약(Action Item 추출) 연구 서베이 및 난점 분석
-
ReturnZero Day 133: 쿠폰함 구현 및 보상(Reward) 구조 설계
-
Triton-Kaldi 오프라인 디코더 아키텍처 설계 및 구현 계획
-
쿠폰함 구현 및 GoodProperties 설계 논의 (Day 134)
-
3i4k 데이터 정제 전략 및 SAC 프로젝트 아키텍처 정의
-
TD3 기반 주식 트레이딩 알고리즘 설계
-
스트림 구현 및 아키텍처 고민
-
Apologize FP & Rule-Based Classifier Issues
-
쿠폰함 기능(VA-633) 설계 및 구현 계획
-
ReturnZero Day 427: SAC 로직 기획 및 Highlighter 구현 방향
-
Callabo 회의록 기능의 방향성 재고 및 우선순위 하향 조정
-
쿠폰함 기능 구현 및 DB 스키마 설계 (Day 163)
-
SAC 통화 요약: 추출형 vs 생성형 요약 전략 및 평가 지표
-
3i4k 모델 성능 저하 분석 및 Pronaia 클라이언트 개발 현황
-
데이터 랜덤픽 구현 및 라이브 피드 아키텍처 설계
-
Recall) 이해 및 HuggingFace Transformers 학습 코드 분석
-
Day 117 (2021-10-25) - S-72 데이터 처리 및 쿠폰함 구현
-
FastAPI 학습
-
ReturnZero Day 124: 쿠폰함 구현 및 기획 변경
-
코드 리뷰 진행
-
쿠폰함 설계 및 AWS 아키텍처 검토 (Day 111)
-
Day 121: 쿠폰함 구현 및 데드락 이슈 대응
-
쿠폰함 구현 및 DB 스키마 마이그레이션 (Day 167)
-
프로나이아 패키지화 및 3i4k FP 검증
-
Day 104: 쿠폰함 설계 및 AWS 로그 중복 문제
-
일본어 음성 전사 파이프라인 설계 및 고려사항
-
BLS 구현 및 배포 준비 (Day 694)
-
쿠폰함 구현 및 Factory 메소드 패턴 적용 (Day 135)
-
2021-10-05 일일 작업 기록: Logstash 오류 해결 및 쿠폰함 기능 설계
-
쿠폰함 기능 설계 및 Docker 운영 실수 기록
-
Day 428. 2022-09-01
-
2023-02-24 작업 기록: 일본어 STT 조사 및 통합 ITN 설계
-
Day 125: 쿠폰함 구현 및 DB 연결 문제 해결
-
3i4k 모델 검증 및 VTS 테스트셋 평가 전략
-
CloudWorker 아키텍처 및 통신 프로토콜 설계 검토
-
gop-kaldi 디코더 구조 분석 및 스트림 전송 설계
-
Day 282. 2022-04-08: GRPC 컴파일 시도 및 GoPRequest 파이프라인 설계
-
Day 471. 2022-10-14
-
Day 119: 쿠폰함 구현 및 DB 호환성 논의
-
STT 관련 고찰
-
ReturnZero Day 291: gRPC 로직 및 Ali-phone 정렬 디버깅
-
Day 99: 쿠폰함 기능 확장 및 DB 설계 논의
-
쿠폰함 모델 리팩터링 및 DB 설계 결정 (Day 169)
-
Day 250: Rescore 구현 완료 및 Triton-Kaldi 환경 구축 삽질
-
리팩토링 시도: cdrewrite 및 transducer 기반 태그 삽입 성능 문제
-
Kaldi BigLM Rescoring 구현 및 하이퍼파라미터 튜닝
-
GoP 계산 파이프라인 분석 및 구현 계획 (Day 275)
-
쿠폰함 어드민 구현 및 JSON 처리 난제 해결
-
쿠폰 기능 확장 및 발급 로직 구현 (Day 105)
-
ReturnZero Day 1118: 음성 인식 전사 오류 및 WFST 디코더 호환성 문제
-
CD 삽질과 쿠폰함 어드민 구현 난관
-
Day 931. 2024-01-18
-
Triton-Kaldi 오프라인 디코더 구현 및 Triton 배치 처리 분석
-
Day 897: E2E 테스트, 데이터 증강 및 LM 적용 논의
-
Triton-Kaldi Offline Decoder 설계 및 HifiGAN 연구
-
Parquet 오디오 데이터 추출 및 전처리 스크립트
-
gRPC 서버 구현 및 iVector 추출 파이프라인 분석 (2022-04-07)
-
소셜 월페어(Social Welfare) 스케줄링 메커니즘의 설계 문제
-
ReturnZero Day 858: Confidence Score 적용 및 모델 변경
-
Day 61 (2021-08-30) - ReturnZero 일지
-
ReturnZero E2E 파이프라인 실행 순서 및 데이터 구조 분석
-
ReturnZero 데이터셋 전처리 및 pysommers 파이프라인 디버깅
-
현택의 블록체인 기반 데이터 거래 모델 고찰
-
다듬이 올인: 문장 처리 파이프라인 및 말풍선 병합 로직 설계
-
GoP(Goodness of Pronunciation) 서비스 구현 및 NLP 태스크 검토
-
출력 파이프라인 정리 및 Protobuf 정의 시도
-
3i4k VTS 데이터 전처리 및 BMT 음성 전사 이슈
-
최락권 박사님 세미나: 영상 품질 평가(QA) 및 시각 인지 모델
-
SUJ-298 메일 포워딩 설계 및 AWS SES 비교
-
ReturnZero Day 686: 큐 병목 및 Worker 성능 저하 대응
-
Callabo STT 성능 개선 및 일본어 Qoo10 데이터 얼라인 전략
-
2022-12-26 회사 근황 및 NLP 기술 검토
-
압축 이슈 해결
-
쿠폰함 페어코딩 및 테스트 코드 작성 (Day 162)
-
ReturnZero Day 1147: AM 모델 학습 API 테스트
-
rt-tokenizer CLI 구현 및 백엔드 디토크나이징 파이프라인 적용
-
Triton-Kaldi 통합 테스트 및 팅커벨 사전 기능 설계 (Day 231)
-
ITN 개발 및 에이전트 아키텍처 논의 (Day 680)
-
다듬이: 텍스트 처리 파이프라인 성능 최적화 및 병렬화 실험
-
ReturnZero Day 532: Kiwi 모델 검증 및 일본어 숫자 태깅 규칙 분석
-
Day 461. 2022-10-04
-
Day 366. 2022-07-01
-
ReturnZero Day 482: 비즈니스 통화 스크립트 검토 및 결과 비교 실험
-
현대캐피탈 고도화 및 utterance 암호화 구현 현황
-
VITO 요약 회의 및 RoBERTa 의도 분석 모델 논의
-
안드로이드 인증 구현 및 Keycloak 연동 고민
-
Kaldi 기반 GoP(Goodness of Pronunciation) 구현 분석 및 코드 탐색
-
TCER) 구현 분석
-
다듬이: 음성 텍스트 전처리 로직 개선
-
Vocab 실험 및 작업량 분석
-
Day 301. 2022-04-27
-
Day 902: Audio Feature Extraction & Model Check
-
다듬이 마무리 (Day 702)
-
일본어 STT 이슈
-
Triton Ensemble 구현 및 NLP4STT 띄어쓰기 이슈
-
Day 14. 2021-07-14
-
Day 497. 2022-11-09
-
화행 분석을 위한 한국어 형태소 분석기 평가 및 규칙 기반 접근의 한계
-
NLP 팀 회의 및 다음 작업 아이템 (2022-05-12)
-
일본어 STT 모델 벤치마킹 및 인프라 작업 기록 (2025-01-14)
-
Day 323. 2022-05-19
-
dadumi lang 포함
-
2024-09-19 업무: 일본어 STT 모델 튜닝 및 Prefix Decoder 디버깅
-
GoP-Kaldi 파이프라인 구현 막힘: 어터런스 단위와 디코더 가정의 불일치
-
ReturnZero Day 1489: utterance 암호화 구현 및 Next Model(일본어) 탐색
-
프로나이아 모델 배포 및 스마트 어터런스 처리 로직 설계
-
NLP 문제 정의
-
ReturnZero Day 640: 텍스트 처리 파이프라인 리팩토링 및 세그멘테이션 이슈
-
맞춤법 데이터 구조 및 토크나이징 전략 논의
-
NLP 모델 오류 패턴 분석 및 개선 방안 (2022-10-28)
-
ReturnZero 분류 모델 성능 보정 실험 (Day 401)
-
Day 335. 2022-05-31
-
Project-K 지역락 이슈 및 모델 이미지 재퍼블리시
-
GOP 디코더 디버깅: iVector 차원 불일치 문제
-
Stock Trader 데이터 준비 및 아키텍처 검토
-
현대캐피탈 고도화 이슈 대응 및 utterance_save 암호화 구현
-
2017-06-20: 기고서 수정, 웹워커 설계 고민, 제주 출장
-
매크로 (ReturnZero)
-
Day 875. 2023-11-23
-
일본어 STT 개발계 배포 및 벤치마크 실행 기록 (Day 872)
-
일본어 ASR 파이프라인 구축 및 Forced Alignment 문제 해결 시도
-
ReturnZero Day 488: 팀 기조 변경 및 NLP 전략 재정의
-
Day 372 (2022-07-07) 작업 기록
-
Day 329. 2022-05-25
-
gRPC 연동 및 GoP 디버깅 (Day 290)
-
ReturnZero Day 173: 테스트 전략 및 쿠폰함 작업
-
2025-10-16 업무: 일본어 STT 실험 및 KISA 프로젝트 준비
-
일본어 데이터 전사 비교 및 정규화 로직 수정
-
ReturnZero 일본어 배포 및 문서 수정 (Day 1545)
-
Day 153: Jenkins 빌드 스크립트 계획 및 편두통 휴가
-
utterance_save 암호화 구현 및 sims-trainer 구조 개선
-
ReturnZero Day 147: 쿠폰함 개발 및 Go 에러 처리 패턴 고민
-
일본어 프로젝트 진행 상황
-
ReturnZero Day 1047: 일본어 ASR 모델 검증 및 성능 분석
-
폰 데이터 이전 및 정리 체크리스트
-
FreqAI 설정 및 커스텀 데이터 활용 가능성 탐구
-
SAC (Soft Actor-Critic) 강화학습 소개
-
HifiGAN) 학습 현황
-
T4 GPU 환경에서 WFST 모델의 성능 측정 (Day 876)
-
STT 성능 벤치마킹 및 특허 기술 아이디어 정리
-
Conformer 모델 앙상블 및 BLS 통합 실험 (Day 910)
-
Day 904: STT 학습 기능 논의 및 배포 준비 (2023-12-21)
-
Day 901. 2023-12-18
-
dadumi한테 어떻게 task를 줄건데
-
일본어 이름 모델 검증 및 T4 배포 준비
-
일본어 NLP 파이프라인 및 데이터셋 전처리 작업 기록
-
Day 8. 2021-07-08
-
일본어 철자전사 Align 및 신한은행 프로젝트 Kickoff
-
ITN 수정 및 토크나이징 성능 최적화 고민
-
다듬이 및 일본어 모델 처리 논의 (Day 642)
-
ITN 모델 최적화 및 데이터 전처리 작업 기록
-
ASR-ITN 파이프라인 최적화 및 재학습 전략 논의
-
일본어 숫자 및 날짜 처리 로직 개선 (Day 533)
-
일본어 NLP 파이프라인 디버깅 및 코퍼스 구축
-
ReturnZero Day 495: 화자 분리 실패와 룰 기반 FP 감수
-
Day 369. 2022-07-04
-
Day 331. 2022-05-27
-
GoP 발음 평가 및 NLP 과제 방향성 재정의
-
Triton-Kaldi ASR 파이프라인 개선 및 스트레스 테스트 계획
-
Day 212. 2022-01-28
-
ReturnZero Day 1643: 모델 레지스트리 구조화 및 전사 장애 분석
-
Day 131: 쿠폰함 개발 및 동의 현황 쿼리 디버깅
-
Day 1106. 2024-07-11 업무 요약
-
ReturnZero Day 1058: ASR 파이프라인 진행 상황 및 버그 수정
-
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
-
Day 1036: 상태 확인 및 기술적 장애물
-
기가코리아 개발 회의
-
Pronaia Multilang 배포 디버깅 및 utterance_save 암호화 구현
-
SIMS 암호화 구현 및 다국어 모델 파이프라인 논의
-
현대캐피탈 고도화 및 utterance 암호화 구현 진행 상황
-
RL 기반 주식 트레이딩 봇 설계: 에피소드 길이 및 데이터 고려사항
-
Day 847: Triton 테스트 환경 구축 및 특허 전략 논의
-
ReturnZero Day 832: 일본어 인식 실험 및 Prefix Decoder 평가
-
Day 820. 2023-09-28
-
미래에셋 방문 및 일본어 데이터 준비 작업
-
ASR 파싱 및 인프라 요구사항 (Day 791)
-
2023-08-08 작업 일지: 일본어 학습, MWW 배포, Dadumi
-
Day 610: 태스크 정리 (NLP4STT, 다듬이, 일본어 데이터)
-
오전 업무 스몰토크 (Day 597)
-
ITN 이슈: CTM 정보 복구
-
아서의 튜토리얼 - bmt 사용법
-
ReturnZero Day 359: Python Client 완료 및 3i4k 데이터 FP 검증 시작
-
Day 315. 2022-05-11
-
Triton Custom Backend 세미나 준비 및 GoP Decoder 정리
-
Day 303: 모델 이미지 재배포 및 TTS 연구 시작
-
Day 264. 2022-03-21
-
ASR), 인프라 혼돈
-
Day 175: 쿠폰함 테스트 페어코딩 및 어드민 기능 확장
-
쿠폰함 Redeem 테스트 코드 작성 및 코드 커버리지 도입
-
Day 15. 2021-07-15
-
utterance_save 암호화 구현 및 SIMS 파이프라인 수정
-
Day 137: Rails JSON Serialization Issue
-
일본어 STT 모델 튜닝 및 팀벨 서비스 장애 대응
-
가독성 개선
-
Day 106: 지급형 쿠폰 기능 개발 및 알고리즘 학습
-
개인정보 수집 오남용 및 연구 방법론 검토 (2023-10-20)
-
Rustdesk 연동 성공 및 Tailscale 활용
-
CLI 도구 숙달을 통한 업무 효율성 향상
-
RLLib 얼라인: 학습 코드 검토 및 Google Trends 데이터 검증
-
현대캐피탈 고도화: utterance_save 암호화 구현 진행 상황
-
ReturnZero Day 1650: 업무 현황 및 제로원 TTS TN 설계 초안
-
GoP(Goodness of Pronunciation) 평가 파이프라인의 C++ 바이너리화 및 Feature Pipeline 문제
-
유튜브 자막 전사 데이터 손실 및 저장소 오류
-
일본어 음성 인식(ASR) 전사 파이프라인 디버깅 및 경량화 시도
-
ReturnZero Day 958: 한자 인식 성능 평가 및 VAD 파라미터 튜닝
-
Day 937: 다드미 버그 수정, 일본어 데이터 수집, 특허 보완
-
ReturnZero Day 860: STT 모델 수정 및 성능 벤치마크
-
일본어 ITN 테스트 및 데이터 문제 확인
-
일본어 TTS 데이터 전처리 및 학습 구성안
-
ReturnZero Day 764: 헬름차트 변경 및 배치 처리 아키텍처 논의
-
ReturnZero Day 700: 샌박 테스트 결과 및 일본어 STT 프로젝트 현황
-
ReturnZero Day 7: 서버 환경 세팅 및 DB 스키마 논의
-
Day 693. 2023-05-24
-
Alignment 설명
-
일본어 ASR 얼라인 및 ITN 파이프라인 개발 (Day 635)
-
2023-03-04 작업 진행 사항 (NLP4STT, 일본어 데이터셋, rt-dadumi)
-
ReturnZero Day 594: 일본어 데이터 파이프라인 및 ITN 아키텍처 검토
-
Day 589. 2023-02-09
-
Day 588: 띄어쓰기 교정 실험 및 KAIST 채용 심사 기록
-
SetFit 제로샷 분류 실험 및 ReturnZero 현황 (Day 545)
-
Day 536. 2022-12-18
-
Kiwi 형태소 분석기 학습 데이터 확보 및 일본어 ITN 개발 현황
-
Kiwi 형태소 분석기 모델 학습 및 데이터 변환 프로세스
-
ReturnZero Day 476: Message Commitment & Townhall Notes
-
Day 448. 2022-09-21
-
Day 365: VTS Trial 실험 결과 및 SAC 킥오프
-
2022-06-20 워크샵 및 모델 실험 기록
-
2022-05-17: 세미나 발표 회고 및 GoP Decoder 문서화
-
Day 300: 도커 배포, ivector 디버깅, gRPC 타임아웃 이슈
-
GOP 디코더 디버깅 및 배포 일정 (Day 296)
-
GOP Online Decoder 테스트 및 디버깅 (Day 286)
-
Day 285. 2022-04-11
-
Triton-Kaldi 컴파일 장애 및 RescoreLatticePostprocessor 심볼 오류
-
Triton-Kaldi 보고 및 CER 준비 (Day 236)
-
Triton-Kaldi 오프라인 디코딩 및 Sommers 데이터셋 연동 문제
-
Day 19. 2021-07-19
-
Day 187. 2022-01-03
-
2026-05-21 업무: PVI 및 일본어 ASR 모델 개선 현황
-
Day 176. 2021-12-23
-
Primary Voice Isolation 및 일본어 ASR 개선 과제
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
Day 168: 쿠폰함 작업 및 구조 변경 대기
-
Day 166. 2021-12-13
-
RTZR 일본어 STT 개발 이력 및 인프라 현황
-
ReturnZero Day 1575: Series C 투자 유치 및 조직 위기 관리
-
일본어 데이터 정제 및 전처리 파이프라인 (Day 1562)
-
2025-09-23 업무: 일본어 배포 및 서울소방 로그 분석
-
쿠폰함 서버 버그 수정 및 Rails 데이터 처리 고민
-
ReturnZero Day 141: 쿠폰 기능 개발 및 버그 디버깅
-
쿠폰함 서비스 개발 및 서버 코드 리팩토링 (Day 132)
-
쿠폰함 서비스 상태 관리 및 로직 개선 (Day 128)
-
DB 반출 작업: 2020 년 이전 가입자 정보 추출
-
Day 112: AWS Cost Data Ingestion & Coupon System
-
일본어 ASR 모델 학습 및 데이터 전처리 진행 상황 (2024-07-15)
-
RTBoost Dataset VAD 오류 및 전처리 파이프라인 수정
-
Day 1022 (2024-04-18) - ReturnZero Daily Note
-
말 25 마리 중 최속 3 선 찾기 문제 (구글 면접)
-
트레이더봇 부분체결 버그 및 LILAC 구현 고민
-
한중일 한자 발음 매핑 및 데이터베이스 구축 구상
-
TentTrade 2.0 마이그레이션 장애요인 및 핵심 요구사항
-
ReturnZero Day 1500: 현대캐피탈 고도화 및 utterance_save 암호화 구현
-
데드락 해결 및 서비스 이슈
-
Day 995. 2024-03-22
-
Day 9. 2021-07-09
-
NLU 기술 동향 및 전시회 메모
-
ReturnZero Day 814: 일본어 모델 학습 속도 문제 및 해결
-
Qoo10 일본어 ASR 파이프라인 및 엔진 성능 테스트 (Day 797)
-
일본어 관련 의심 단어 목록 및 정제 규칙
-
TED 일본어 데이터셋(테스트용)
-
통합 ITN 및 S2 Phase 1 진행 상황 (2023-06-05)
-
ITN 성능 벤치마크 및 토큰화 버그 분석
-
다듬이: Turn 기반 처리 파이프라인 재설계 및 Pandas 인덱스 문제
-
일본어 ASR 파이프라인 설정 및 실험 기록
-
통합 ITN 인터페이스 통일 및 일본어 프로젝트 일정 조정
-
NLP4STT: ITN 및 띄어쓰기 후처리 개선
-
Total ensemble model
-
Pierce 생일 축하 및 FP 긴급 요청 관련 대화
-
프로젝트 Bled 중단 및 SAC 프로젝트 집중
-
Day 364. 2022-06-29
-
Day 356. 2022-06-21
-
2022-06-10: BMT CER 변동 조사 및 Action Item Detection 서베이
-
gip-decoder 배포 및 TTS 아키텍처 검토
-
Day 253: Vito-kaldi 리팩토링 및 Triton-kaldi 반영
-
Day 239. 2022-02-24
-
2021-07-02 개발팀 워크샵 (Day 2)
-
Triton-Kaldi 오프라인 전환 및 백엔드 구조 분석
-
PVI 및 일본어 ASR 모델 개선 현황 (2026-05-22)
-
ReturnZero Day 1785: PVI, 일본어 ASR 개선 및 MWW 배포
-
Day 177. 2021-12-24
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-19)
-
RTZR-STT 패키징 자동화 및 모델 레지스트리 설계
-
쿠폰함 개발 및 기획 변경 (Day 161)
-
Day 16: 페어프로그래밍, SQL 실수 및 테스트 중심 개발
-
KISA 프로젝트 준비 및 일본어 STT 모델 실험 (Day 1570)
-
Day 148: 쿠폰함 에러 처리 및 건강 이상 신호
-
VAD Dynamic Length 및 E2E ASR Config 변경 사항
-
신한카드 RFI 대응 및 STT 엔진 개발 현황 (Day 1034)
-
일본어 데이터셋 구축 및 전사 파이프라인 디버깅
-
Pronaia 온프레미스 세미나 준비 및 데이터 파이프라인 문제 해결
-
TensorTrade 2.0 적용 및 RL 에이전트 디버깅
-
부채 표시)
-
노트 관리 도구 변경 고민 (2022.03.08)
-
현대캐피탈 고도화: 반입 준비, 취약점 스캔, utterance 암호화 구현
-
Day 90: Git 실수, 데드락 논의, Logstash Cron 구현
-
Day 553: 띄어쓰기 벤치마크 설계 및 Pronaia Engine 아키텍처 분석
-
2025-08-22 업무: 현대캐피탈 고도화, 암호화 구현, Next Model 디버깅
-
MWW VAD 임계값 수정 및 테스트
-
PRONAIA 엔진 ITN 파이프라인 오류 (FstOpError)
-
Pronaia STT 환경 설정 및 특허 미팅 기록 (Day 917)
-
일본어 Pronaia 배포 및 ITN 파이프라인 실험
-
팀벨 문의 - 웹소켓-gRPC 연동
-
Day 844. 2023-10-23
-
일본어 STT 모델 배포 준비 및 성능 평가 (Day 838)
-
일본어 ASR 모델 실험 및 데이터 파이프라인 개선 (Day 811)
-
일본어 데이터 전처리 및 정제 규칙 (Day 790)
-
2023-08-22 작업 일지: 일본어 데이터 전처리 및 Pronaia 테스트 환경 구축
-
일본어 ASR 데이터 전처리 및 Pronaia 메시지 구조 정의
-
qoo10 일본어 서버 재가동 및 헬름차트 설정
-
ITN 논의
-
일본어 데이터 전처리 및 ITN 방침 (Day 623)
-
rt-dadumi aligner
-
ITN 파이프라인 통합 및 일본어 정규화 작업 현황 (Day 602)
-
ITN 규칙 대응 및 Kiwi 기반 NLP 파이프라인 개선
-
Kiwi NLP 모델 빌딩 및 데이터 전처리 작업 기록
-
맞춤법 검사 자동화 봇 및 데이터 파싱 로직
-
Day 5. 2021-07-05
-
Python Client 초기 배포 및 구조 검토 (Day 358)
-
Day 306: GoP Decoder 문서화 및 Triton Backend 연구
-
GOP 프로젝트: ivector 문제 탐색 및 도커 배포 준비 (Day 299)
-
안정성 문제 해결
-
GOP 계산 오류 디버깅 및 gRPC 서버 테스트 (Day 292)
-
Kaldi Feature Pipeline 및 iVector 추출 탐색 (Day 272)
-
ReturnZero Day 1765: PVI 및 일본어 ASR 모델 개선 현황
-
ReturnZero Day 1756: PVI 및 일본어 ASR 개선 이슈
-
PVI 성능 개선 및 일본어 ASR 모델 이슈 분석
-
ReturnZero Day 1749: PVI 및 일본어 ASR 개선 작업
-
Primary Voice Isolation(PVI) 및 일본어 ASR 개선 현황
-
쿠폰 시스템 리팩토링 및 마이그레이션 (Day 174)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-13)
-
S2 리빌드 문서화 및 다국어 RTFx 측정 환경 구축
-
Day 160. 2021-12-07
-
Day 159: 쿠폰함 리뷰 및 서버 이슈 대응 (2021-12-06)
-
일본어 ASR 모델 (Cutoff) 벤치마킹 및 배포 준비
-
2025-09-16 일본어 모델 배포 및 설정 작업
-
어드민 개발 및 서버 접속 이슈
-
쿠폰함 서버 개발 및 Go 디자인 패턴 적용 (Day 138)
-
프로나이아(Pronaia) 전사 요약 기능 개발 및 Kubespray 정리
-
Day 126: 쿠폰 기능 개발 및 테스트 디버깅
-
Day 1104 (2024-07-09) - ReturnZero Daily Note
-
ReturnZero Day 1061: STT 엔지니어링 및 평가 현황
-
Day 1043: PII Redaction Filter 개발 및 On-Prem 모델 관리
-
Ancom Workbench
-
비트코인 상승장 구간 정의 및 데이터 수집 계획
-
현대캐피탈 고도화 운영 준비 및 SIMS 암호화 구현 현황
-
주소 인식 모델 성능 검증 및 Triton 배포 전략
-
ReturnZero Day 903: 모델 최적화 시도 및 성능 벤치마크
-
2023 년 1 월~12 월 업무 회고 및 일본어 ITN 개발 이력
-
Whisper Dadumi 대응 및 언어 정보 처리
-
일본어 Neural ITN 및 4090 환경 빌드 시도
-
Day 800: 세팅 및 ITN 워커 스펙 변경
-
새 일본어 고객 (Day 786)
-
일본어 NLP 데이터 정제 및 운영 라이선스 발급
-
일본어 데이터셋 전환 및 Quota 서비스 로직 수정
-
ITN: 텍스트 토크나이징 및 인퍼런스 파이프라인 개선
-
T4 빌드 및 일본어 NLP 처리 방안
-
다듬이: 단어 정렬 및 매핑 알고리즘 개선
-
통합 ITN(다듬이) 아키텍처 및 프로젝트 현황
-
ITN 성능 병목 분석 및 일본어 전사 개선 방향
-
긴 입력 처리 아키텍처 검토 (Day 586)
-
ITN-JP 숫자 변환 및 테스트셋 구축 (Day 535)
-
일본어 ITN 포팅 착수 및 띄어쓰기 복원 알고리즘 고민
-
TTS 후순위 전환 및 ASR 집중 전략 수립 (2022-05-23)
-
삼성 마지막 날: GRPC 서버 개발 및 TTS 요구사항 정의
-
Day 247. 2022-03-04
-
Day 203: Sommers Dataset Testing & Detokenization Issues
-
Triton-Kaldi 통합 및 Kaldi 레시피 구조 분석 (Day 190)
-
ReturnZero Day 1748: PVI 및 일본어 ASR 개선 작업
-
ReturnZero Day 1743: PVI, 일본어 ASR 개선 및 신한 SDK 빌드
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-16)
-
2026-01-14 업무 및 일본어 모델 배포 준비
-
SIMS 모델 배포 및 게이트웨이 설정 작업
-
2025-10-14 업무: 일본어 STT 튜닝 실험 및 제로원 제안서 초안
-
현대캐피탈 고도화 및 utterance_save 암호화 구현 현황 (2025-08-06)
-
현대캐피탈 고도화 및 utterance_save 암호화 구현 현황 (2025-08-05)
-
현대캐피탈 고도화 및 utterance_save 암호화 구현 현황 (2025-08-04)
-
ReturnZero Day 1062: 워크샵 및 거대모델 대체 전략 논의
-
음성 데이터 전사 및 변환 작업 현황 (2024-05-22)
-
Day 1. 2021-07-01
-
논문 발표자료 구성 및 실험 설계 전략
-
BSWACA 오프로딩 전략 및 리소스 할당 고민
-
STT-LLM-TTS 챗봇 기술 스택 및 설정 초안
-
polyglot-ko 서빙 준비도
-
2025-08-20 업무: 현대캐피탈 고도화, 암호화 구현, Next Model 환경 구축
-
일본어 TMN 회의 및 팀벨 클러스터 작업
-
배포 워크플로우 논의 (Day 859)
-
단위별 Confidence 및 Entropy 계산 로직 정립
-
데이터 전략 논의 (Day 845)
-
일본어 NLP 화이트리스트 및 배포 기록
-
2023-07-05 작업 계획 및 MWW 연동 이슈 해결
-
프로나이아 엔진 아키텍처 및 운영 이슈 (Day 715)
-
주소 모델 개발 현황
-
Day 699: dadumi 배포 및 일본어 ASR 평가
-
일본어 처리 이슈
-
일본어 qoo10 음성 전사 및 정렬 문제 해결 시도
-
다듬이 (Day 663)
-
Day 657: Vito Worker 배포 및 rt-neural-itn Torch 의존성 제거
-
다듬이: 일본어 ITN 및 배포 준비
-
2023-03-23 작업 기록: 일본어 ITN 및 Qoo10 ASR 정렬
-
rt-gec 토크나이저 이슈 및 일본어 ITN 학습 데이터 가이드라인
-
Neural-ITN TensorRT 배포 시도 및 한계
-
NLP4STT: ITN 평가 메트릭 및 pysommers 의존성 고민
-
일본어 ITN(숫자 읽기) 디버깅 및 워커 개발
-
Day 491: E2E 음성 인식 서버 배포 장애 및 Kaldi 대체안 검토
-
BMT Pronaia VAD 오류 해결 및 seq2seq 학습 기록
-
2022-05-18 일일 작업 기록: 서베이 및 배포 프로세스 개선 논의
-
GoP 입력 파일 비교
-
Triton-Kaldi Offline Decoder 리팩토링 및 TTS 학습 진행 상황 (Day 259)
-
Day 205: 오프라인 디코더 비교 실험 및 화자분리 장애 대응
-
Triton-Kaldi 디코딩 파이프라인 분석 및 Sommers 후처리 장애
-
ASR 모델 개선 현황: PVI, 일본어, MWW 화물맨
-
PVI 최적화 및 일본어 ASR 모델 개선 현황 (2026-05-06)
-
PVI 성능 최적화 및 일본어 ASR 모델 개선 현황
-
ReturnZero Day 1762: PVI 및 일본어 ASR 개선 현황
-
2026-04-23 업무: PVI 및 일본어 ASR 개선
-
TTS 개선 및 S2 리빌드
-
2026-01-27 업무: 제로원 TTS, 일본어 ASR 개선, 두나무 유지보수
-
2026-01-22 업무 및 모델 개선 이슈
-
2026-01-20 업무: 제로원 TTS 데이터 정제 및 일본어 STT 모델 배포 가이드
-
ReturnZero Day 1622: STT 파이프라인 개선 및 배포 인프라 작업
-
rtzr-stt Pacman 개선 및 VAD 필터 기술 검토
-
2025-10-15 업무 및 일본어 ASR 모델 평가
-
Day 145: 쿠폰함 디버깅, 코드 프리즈 및 트랜스크라이버 성능 분석
-
Triton 이미지 교체 및 Pronaia Engine 배포 작업
-
일본어 주소 인식 모델 배포 및 MWW STT 성능 검증
-
TMN 회의: 일본어 4자리 숫자 인식 오류 분석
-
Pronaia Engine Keyword Boosting 모델 전사 테스트 및 배포 준비
-
Timbel 전사 속도 최적화: VAD Trailing Time 조정
-
Excalidraw Drawing (2026-01-01)
-
Tensortrade의 Gymnasium 및 Ray 호환성 개선
-
주소 인식 모델 서빙 방식 결정: ONNX Dynamic vs TRT
-
Day 942: vito-worker 배포 및 STT 파이프라인 설정
-
mel2vec 영숫자 인식 성능 검증 및 패딩 실험 결과
-
VAD 임계값이 이름 학습 모델 성능에 미치는 영향 실험
-
ReturnZero Day 837: 일본어 ASR 평가 및 엔진 개발
-
일본어 ASR 파인튜닝 준비 및 코드 수정
-
2023-07-27 작업 계획: 일본어 모델 배포 및 Triton 설정
-
dadumi 버그 수정 및 Pronaia API 구조 분석
-
주소 교정 (Address Correction)
-
2023-05-12 일본어 모델 학습 및 얼라인, ITN 서비스화 진행 상황
-
Day 665: ITN 모델 배포 장애 및 환경 정리
-
다드미 배포 논의: Align 알고리즘 병목 및 버그 분석
-
Day 555: ONNX 모델 배포 및 환경 구성 고민
-
pysommers 개발 진행 상황 및 반성 (2023-01-03)
-
NLP4STT 점검: ITN, TER 메트릭 및 테스트셋 구축
-
AICT 문장 띄어쓰기 벤치마크 및 워커 컨테이너 테스트
-
2022-12-13 작업 기록: NLP 파이프라인 디버깅 및 일본어 ITN 통합
-
일단 합쳤다가 풀기 (Batch Processing & Async Architecture)
-
2022-11-21 작업 기록: 한글 교정 로직 수정 및 Highlighter PoC 환경 설정
-
Pysommers BMT CER 계산 및 화자 구분 세미나 노트
-
GOP 디코더 PoC 배포 및 검증 우선순위 재정의