구어체 대화에서 패턴이 여러 발화에 걸쳐 분산되어 있는 문제를 해결하기 위해, 시간 인접성과 화자 정보를 기준으로 단편적 발화(Fragment)를 문장 단위로 병합하는 전처리 방식을 제안함. 병합된 문장에 대해 WFST 기반의 아토믹 클래스 분류 및 중요 문장 패턴 검출을 수행한 후, 결과를 다시 발화 단위로 매핑하여 출력하는 전체 파이프라인과 구체적인 규칙 세트를 정의함.
-
다듬이 올인: 문장 처리 파이프라인 및 말풍선 병합 로직 설계
-
가치 있는 발화 추출의 어려움과 SAC 방향성 고민
-
FST 기반 분류기 구조 및 코드 리팩토링 (Day 435)
-
WFST 엔진 구현 및 토큰 파싱 로직 설계
-
약속) 성능 분석 및 정제 전략
-
Composite rule: 해시 검증의 한계와 조합 폭발 문제
-
WFST 분류기 및 복합 클래스 우선순위 처리
-
미팅 요약 서베이 및 화행 분석
-
맞춤법 데이터 구조 및 토크나이징 전략 논의
-
ITN 규칙 대응 및 Kiwi 기반 NLP 파이프라인 개선
-
WFST 규칙 최적화 및 성능 평가 (Day 404)
-
옵셔널 구문 설계
-
WFST 코드 보완 및 분류 모델 성능 평가 (Day 400)
-
Rule-based NER 및 Semantic Role Labeling 구현 전략
-
ReturnZero: WFSTClassifier 리팩토링 및 명명 규칙 정리
-
ReturnZero: 컴포짓 클래스 및 라벨링 규칙 설계 고민
-
WFST 테스트 코드 및 규칙 개발 (Day 391)
-
Highlighter 구조 및 패턴 감별 방식 고찰
-
Day 390: 핵심성분 분석 및 WFST 테스트 진행
-
다듬이: Turn 기반 처리 파이프라인 재설계 및 Pandas 인덱스 문제
-
WFST 인터페이스 및 파인튜닝 진행 상황 (Day 383)
-
WFST 목록화 및 의존성 구문 분석 탐색
-
Day 385 (2022-07-20): WFST 개발 및 휴가 잔여일 계산
-
GOP 개발 및 기술적 고민 (2022-07-13)
-
WFST 최적화 및 결정화 알고리즘 검토
-
어미 처리 실험
-
WFST 연구 및 화행 레이블링 회의 기록 (Day 370)
-
WFST 어미 인식 개선 및 gop-decoder S3 연동 계획
-
WFST 엔진 구현 및 Commitment 작업 (Day 392)
-
수열 패턴 및 제곱근 근사 공식 탐구 (2019)
-
WFST 엔진 개발 및 토큰 태그 삽입 로직 개선 (Day 399)
-
pynini 학습 노트
-
스크립트 기반 자동 타이핑 기계 아이디어
-
Fine-tuning 개념 정리
-
NLP 라벨링 도구: 예측 및 비교 스크립트
-
라벨링 가이드라인 및 카테고리 정의 (Day 478)
-
리팩토링 요소
-
rt-itn-jp 코드 모델 및 WFST 구현 계획
-
Qoo10 rtboost 구현 및 dadumi aligner 알고리즘 설계 고민
-
Hypernetwork 구조 분석 및 한계점
-
오프로딩: 속도 할당 및 유틸리티 함수 설계
-
3i4k 데이터셋을 활용한 화행분류 Feasibility 검토
-
ReturnZero E2E 파이프라인 실행 순서 및 데이터 구조 분석
-
ReturnZero 데이터셋 전처리 및 pysommers 파이프라인 디버깅
-
ITN: 텍스트 토크나이징 및 인퍼런스 파이프라인 개선
-
일본어 음성 전사 파이프라인 설계 및 고려사항
-
TD3 기반 주식 트레이딩 알고리즘 설계
-
다듬이: 텍스트 처리 파이프라인 성능 최적화 및 병렬화 실험
-
ReturnZero Day 640: 텍스트 처리 파이프라인 리팩토링 및 세그멘테이션 이슈
-
ASR-ITN 파이프라인 최적화 및 재학습 전략 논의
-
화행 분석을 위한 한국어 형태소 분석기 평가 및 규칙 기반 접근의 한계
-
Alignment 설명
-
현택의 블록체인 기반 데이터 거래 모델 고찰
-
RTBoost Dataset VAD 오류 및 전처리 파이프라인 수정
-
Pronaia 온프레미스 세미나 준비 및 데이터 파이프라인 문제 해결
-
일본어 ASR 얼라인 및 ITN 파이프라인 개발 (Day 635)
-
Day 282. 2022-04-08: GRPC 컴파일 시도 및 GoPRequest 파이프라인 설계
-
리팩토링 시도: cdrewrite 및 transducer 기반 태그 삽입 성능 문제
-
ITN 파이프라인 통합 및 일본어 정규화 작업 현황 (Day 602)
-
일본어 ASR 파이프라인 설정 및 실험 기록
-
일본어 ASR 파이프라인 구축 및 Forced Alignment 문제 해결 시도
-
ReturnZero Day 532: Kiwi 모델 검증 및 일본어 숫자 태깅 규칙 분석
-
일어 음성 처리 파이프라인 디버깅 및 ITN 수정
-
Confidence 구현
-
ReturnZero Day 594: 일본어 데이터 파이프라인 및 ITN 아키텍처 검토
-
ReturnZero 분류 모델 성능 보정 실험 (Day 401)
-
Day 428. 2022-09-01
-
Parquet 오디오 데이터 추출 및 전처리 스크립트
-
ReturnZero Day 495: 화자 분리 실패와 룰 기반 FP 감수
-
ReturnZero Day 1058: ASR 파이프라인 진행 상황 및 버그 수정
-
일본어 Pronaia 배포 및 ITN 파이프라인 실험
-
일본어 데이터 정제 및 전처리 파이프라인 (Day 1562)
-
Callabo STT 성능 개선 및 일본어 Qoo10 데이터 얼라인 전략
-
Whisper Dadumi 대응 및 언어 정보 처리
-
다드미 배포 논의: Align 알고리즘 병목 및 버그 분석
-
Day 931. 2024-01-18
-
3i4k 데이터 정제 전략 및 SAC 프로젝트 아키텍처 정의
-
일본어 관련 의심 단어 목록 및 정제 규칙
-
2023-02-24 작업 기록: 일본어 STT 조사 및 통합 ITN 설계
-
PRONAIA 엔진 ITN 파이프라인 오류 (FstOpError)
-
일본어 NLP 파이프라인 및 데이터셋 전처리 작업 기록
-
일본어 NLP 파이프라인 디버깅 및 코퍼스 구축
-
Day 471. 2022-10-14
-
일본어 ASR 모델 실험 및 데이터 파이프라인 개선 (Day 811)
-
일본어 데이터 전처리 및 정제 규칙 (Day 790)
-
일본어 데이터셋 구축 및 전사 파이프라인 디버깅
-
다듬이: 음성 텍스트 전처리 로직 개선
-
SAC 통화 요약: 추출형 vs 생성형 요약 전략 및 평가 지표
-
프로나이아 모델 배포 및 스마트 어터런스 처리 로직 설계
-
Greedy Confidence 및 Entropy 기반 신뢰도 추론 아키텍처
-
2022-12-13 작업 기록: NLP 파이프라인 디버깅 및 일본어 ITN 통합
-
Triton-Kaldi ASR 파이프라인 개선 및 스트레스 테스트 계획
-
맞춤법 봇: 띄어쓰기 교정 로직 및 API 테스트
-
회의록 요약(Action Item 추출) 연구 서베이 및 난점 분석
-
NLP 팀 회의 및 다음 작업 아이템 (2022-05-12)
-
Qoo10 일본어 ASR 파이프라인 및 엔진 성능 테스트 (Day 797)
-
AICT 문장 띄어쓰기 벤치마크 및 워커 컨테이너 테스트
-
일본어 TTS 기반 학습 및 주소 전사 실험 노트
-
Day 942: vito-worker 배포 및 STT 파이프라인 설정
-
Day 897: E2E 테스트, 데이터 증강 및 LM 적용 논의
-
ReturnZero Day 858: Confidence Score 적용 및 모델 변경
-
단위별 Confidence 및 Entropy 계산 로직 정립
-
일본어 ITN (Inverse Text Normalization) 처리 규칙 및 문제점
-
ReturnZero Day 1622: STT 파이프라인 개선 및 배포 인프라 작업
-
다듬이: 단어 정렬 및 매핑 알고리즘 개선
-
맞춤법 검사 자동화 봇 및 데이터 파싱 로직
-
Apologize FP & Rule-Based Classifier Issues
-
Callabo 회의록 기능의 방향성 재고 및 우선순위 하향 조정
-
FastAPI 학습
-
Stock Trader 데이터 준비 및 아키텍처 검토
-
SetFit 제로샷 분류 실험 및 ReturnZero 현황 (Day 545)
-
IP 돌리기 및 Kiwi 한국어 띄어쓰기 규칙 분석
-
일본어 ITN 테스트 및 데이터 문제 확인
-
ITN 수정 및 토크나이징 성능 최적화 고민
-
ITN 개발 및 에이전트 아키텍처 논의 (Day 680)
-
rt-dadumi: 타임스탬프 복구 및 세그먼트 처리 로직
-
Total ensemble model
-
2022-12-26 회사 근황 및 NLP 기술 검토
-
STT 관련 고찰
-
ReturnZero Day 482: 비즈니스 통화 스크립트 검토 및 결과 비교 실험
-
Day 497. 2022-11-09
-
dadumi lang 포함
-
RL 기반 주식 트레이딩 봇 설계: 에피소드 길이 및 데이터 고려사항
-
MWW 배포 및 ASR 파이프라인 디버깅 (2024-03-12)
-
BMT 평가 파이프라인 디버깅 및 데이터 처리 이슈
-
GOP(Kaldi) 구현 준비 및 GRPC 프로토콜 설계
-
Triton 배포 및 모델 컴파일 파이프라인 정리 (Day 576)
-
쿠폰함 설계 및 AWS 아키텍처 검토 (Day 111)
-
TED 일본어 데이터셋(테스트용)
-
ReturnZero Day 686: 큐 병목 및 Worker 성능 저하 대응
-
ITN 성능 벤치마크 및 토큰화 버그 분석
-
일본어 STT 이슈
-
ITN 이슈: CTM 정보 복구
-
ReturnZero Day 291: gRPC 로직 및 Ali-phone 정렬 디버깅
-
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
-
한중일 한자 발음 매핑 및 데이터베이스 구축 구상
-
Day 946: YouTube 데이터 파이프라인 실험 및 Worker 테스트 이슈
-
2017-06-20: 기고서 수정, 웹워커 설계 고민, 제주 출장
-
ITN 논의
-
Day 461. 2022-10-04
-
Day 323. 2022-05-19
-
ReturnZero Day 427: SAC 로직 기획 및 Highlighter 구현 방향
-
VITO 요약 회의 및 RoBERTa 의도 분석 모델 논의
-
ReturnZero Day 1147: AM 모델 학습 API 테스트
-
gRPC 서버 구현 및 iVector 추출 파이프라인 분석 (2022-04-07)
-
rtzr-stt 파이프라인 개선 및 STT 인식 오류 분석 (2025-11-12)
-
SIMS 헬름 구성 및 파이프라인 자동화 고민
-
강화학습 기반 암호화폐 자동매매 프로젝트 제안
-
Day 937: 다드미 버그 수정, 일본어 데이터 수집, 특허 보완
-
Vocab 실험 및 작업량 분석
-
Day 902: Audio Feature Extraction & Model Check
-
미래에셋 방문 및 일본어 데이터 준비 작업
-
다듬이 마무리 (Day 702)
-
일본어 처리 이슈
-
2023-05-12 일본어 모델 학습 및 얼라인, ITN 서비스화 진행 상황
-
다듬이 및 일본어 모델 처리 논의 (Day 642)
-
일본어 데이터 전처리 및 ITN 방침 (Day 623)
-
2023-03-04 작업 진행 사항 (NLP4STT, 일본어 데이터셋, rt-dadumi)
-
ITN 모델 최적화 및 데이터 전처리 작업 기록
-
통합 ITN 인터페이스 통일 및 일본어 프로젝트 일정 조정
-
오전 업무 스몰토크 (Day 597)
-
NLP4STT: ITN 및 띄어쓰기 후처리 개선
-
NLP4STT: Neural ITN Triton화 및 배치 처리
-
Day 369. 2022-07-04
-
가독성 개선
-
Day 1036: 상태 확인 및 기술적 장애물
-
RLLib 얼라인: 학습 코드 검토 및 Google Trends 데이터 검증
-
Trt) 시도 및 실패 기록
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
GoP 계산 파이프라인 분석 및 구현 계획 (Day 275)
-
쿠폰함 모델 리팩터링 및 DB 설계 결정 (Day 169)
-
Day 104: 쿠폰함 설계 및 AWS 로그 중복 문제
-
SommersV4 Transcribe 파이프라인 분석 및 DevOps 이슈
-
쿠폰함 기능 설계 및 Docker 운영 실수 기록
-
일본어 이름 모델 검증 및 T4 배포 준비
-
ReturnZero Day 814: 일본어 모델 학습 속도 문제 및 해결
-
일본어 ASR 데이터 전처리 및 Pronaia 메시지 구조 정의
-
통합 ITN 및 S2 Phase 1 진행 상황 (2023-06-05)
-
NLP 문제 정의
-
ITN Triton 통합 배포 및 스레드 풀 문제
-
T4 빌드 및 일본어 NLP 처리 방안
-
Day 610: 태스크 정리 (NLP4STT, 다듬이, 일본어 데이터)
-
Day 61 (2021-08-30) - ReturnZero 일지
-
ITN-JP 숫자 변환 및 테스트셋 구축 (Day 535)
-
일본어 숫자 및 날짜 처리 로직 개선 (Day 533)
-
Day 372 (2022-07-07) 작업 기록
-
3i4k 모델 검증 및 VTS 테스트셋 평가 전략
-
Day 335. 2022-05-31
-
Primary Voice Isolation(PVI) 및 일본어 ASR 개선 현황
-
일본어 데이터 전사 비교 및 정규화 로직 수정
-
ReturnZero 일본어 배포 및 문서 수정 (Day 1545)
-
2024-09-19 업무: 일본어 STT 모델 튜닝 및 Prefix Decoder 디버깅
-
신한카드 RFI 대응 및 STT 엔진 개발 현황 (Day 1034)
-
일본어 음성 인식(ASR) 전사 파이프라인 디버깅 및 경량화 시도
-
GoP-Kaldi 파이프라인 구현 막힘: 어터런스 단위와 디코더 가정의 불일치
-
삼성 SW 검정 프로페셔널 준비 및 재원 형과의 대화
-
Triton-Kaldi 오프라인 디코더 아키텍처 설계 및 구현 계획
-
rt-tokenizer CLI 구현 및 백엔드 디토크나이징 파이프라인 적용
-
쿠폰함 구현 및 GoodProperties 설계 논의 (Day 134)
-
Day 820. 2023-09-28
-
일본어 TTS 데이터 전처리 및 학습 구성안
-
Day 800: 세팅 및 ITN 워커 스펙 변경
-
주소 모델 개발 현황
-
Day 536. 2022-12-18
-
Kiwi 형태소 분석기 학습 데이터 확보 및 일본어 ITN 개발 현황
-
Kiwi 형태소 분석기 모델 학습 및 데이터 변환 프로세스
-
Kiwi NLP 모델 빌딩 및 데이터 전처리 작업 기록
-
Day 448. 2022-09-21
-
3i4k 모델 성능 저하 분석 및 Pronaia 클라이언트 개발 현황
-
Recall) 이해 및 HuggingFace Transformers 학습 코드 분석
-
2025-10-16 업무: 일본어 STT 실험 및 KISA 프로젝트 준비
-
일본어 STT 모델 벤치마킹 및 인프라 작업 기록 (2025-01-14)
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
ReturnZero Day 133: 쿠폰함 구현 및 보상(Reward) 구조 설계
-
Primary Voice Isolation (PVI) 파이프라인 개선 및 일본어 ASR 모델 이슈
-
Day 99: 쿠폰함 기능 확장 및 DB 설계 논의
-
쿠폰함 기능 구현 및 DB 스키마 설계 (Day 163)
-
코드 리뷰 진행
-
주소 인식 모델 서빙 방식 결정: ONNX Dynamic vs TRT
-
2023 년 1 월~12 월 업무 회고 및 일본어 ITN 개발 이력
-
ITN 배포용 메트릭 설정 및 K8s 테스트베드 구축
-
Day 875. 2023-11-23
-
dadumi한테 어떻게 task를 줄건데
-
일본어 철자전사 Align 및 신한은행 프로젝트 Kickoff
-
일본어 NLP 데이터 정제 및 운영 라이선스 발급
-
통합 ITN(다듬이) 아키텍처 및 프로젝트 현황
-
NLP4STT: ITN 평가 메트릭 및 pysommers 의존성 고민
-
일본어 ITN(숫자 읽기) 디버깅 및 워커 개발
-
2022-06-20 워크샵 및 모델 실험 기록
-
Project-K 지역락 이슈 및 모델 이미지 재퍼블리시
-
Day 301. 2022-04-27
-
Primary Voice Isolation 및 일본어 ASR 개선 과제
-
Day 14. 2021-07-14
-
일본어 프로젝트 진행 상황
-
Day 1106. 2024-07-11 업무 요약
-
TMN 회의: 일본어 4자리 숫자 인식 오류 분석
-
폰 데이터 이전 및 정리 체크리스트
-
스트림 구현 및 아키텍처 고민
-
polyglot-ko 서빙 준비도
-
2021-10-05 일일 작업 기록: Logstash 오류 해결 및 쿠폰함 기능 설계
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
Gemma2 기술 검토
-
dadumi-whisper 파이프라인 개선 및 현대캐피탈 업무
-
Pierce 생일 축하 및 FP 긴급 요청 관련 대화
-
TTS 연구 파이프라인 정의 및 Project-K 협업 회고
-
gop-kaldi 디코더 구조 분석 및 스트림 전송 설계
-
Triton-Kaldi 디코딩 파이프라인 분석 및 Sommers 후처리 장애
-
SIMS 암호화 구현 및 다국어 모델 파이프라인 논의
-
학습 파이프라인 개선
-
CloudWorker 아키텍처 및 통신 프로토콜 설계 검토
-
STT 성능 벤치마킹 및 특허 기술 아이디어 정리
-
ReturnZero Day 903: 모델 최적화 시도 및 성능 벤치마크
-
Day 901. 2023-12-18
-
일본어 Neural ITN 및 4090 환경 빌드 시도
-
ASR 파싱 및 인프라 요구사항 (Day 791)
-
2023-08-22 작업 일지: 일본어 데이터 전처리 및 Pronaia 테스트 환경 구축
-
주소 교정 (Address Correction)
-
ReturnZero Day 700: 샌박 테스트 결과 및 일본어 STT 프로젝트 현황
-
Day 693. 2023-05-24
-
일본어 qoo10 음성 전사 및 정렬 문제 해결 시도
-
rt-gec 토크나이저 이슈 및 일본어 ITN 학습 데이터 가이드라인
-
Day 589. 2023-02-09
-
ITN 성능 병목 분석 및 일본어 전사 개선 방향
-
NLP4STT 점검: ITN, TER 메트릭 및 테스트셋 구축
-
RL 모델 서빙 고민
-
Kiwi 모델 빌더 세그먼트 폴트 디버깅 및 ITN 초기 조사
-
NLP4STT: 교정 전후 문자열 매핑 및 띄어쓰기 복원 알고리즘
-
Day 365: VTS Trial 실험 결과 및 SAC 킥오프
-
ReturnZero Day 359: Python Client 완료 및 3i4k 데이터 FP 검증 시작
-
프로나이아 패키지화 및 3i4k FP 검증
-
Day 331. 2022-05-27
-
TTS 후순위 전환 및 ASR 집중 전략 수립 (2022-05-23)
-
Day 212. 2022-01-28
-
Day 187. 2022-01-03
-
ReturnZero Day 1765: PVI 및 일본어 ASR 모델 개선 현황
-
ReturnZero Day 1749: PVI 및 일본어 ASR 개선 작업
-
KISA 프로젝트 준비 및 일본어 STT 모델 실험 (Day 1570)
-
일본어 음성 인식 파인튜닝: 문자셋 재정의 및 데이터 혼합 비율 조정
-
멀티뷰 학습 및 vLLM 서빙 엔진 탐색
-
Day 1009: 팀벨 레이턴시 이슈 및 일본어 E2E 세그멘테이션
-
레벤슈타인 거리 (Levenshtein Distance) 알고리즘
-
2026-01-19 업무: 제로원 TTS 데이터 파이프라인 및 일본어 ASR 모델 개선
-
출력 파이프라인 정리 및 Protobuf 정의 시도
-
Kaldi GoP 파이프라인 분석 및 Decodable 인터페이스 혼선
-
PVC 구성 전략 (ReturnZero)
-
쿠폰함 기능(VA-633) 설계 및 구현 계획
-
Triton-Kaldi Offline Decoder 설계 및 HifiGAN 연구
-
utterance_save 암호화 구현 및 SIMS 파이프라인 수정
-
유튜브 자막 전사 데이터 손실 및 저장소 오류
-
Conformer 모델 앙상블 및 BLS 통합 실험 (Day 910)
-
Day 904: STT 학습 기능 논의 및 배포 준비 (2023-12-21)
-
일본어 STT 개발계 배포 및 벤치마크 실행 기록 (Day 872)
-
ReturnZero Day 860: STT 모델 수정 및 성능 벤치마크
-
Day 847: Triton 테스트 환경 구축 및 특허 전략 논의
-
ReturnZero Day 832: 일본어 인식 실험 및 Prefix Decoder 평가
-
2023-08-08 작업 일지: 일본어 학습, MWW 배포, Dadumi
-
ReturnZero Day 764: 헬름차트 변경 및 배치 처리 아키텍처 논의
-
qoo10 일본어 서버 재가동 및 헬름차트 설정
-
일본어 ASR 실험 및 Utterance Segmenter 개발 현황
-
다듬이 (Day 663)
-
다듬이: 일본어 ITN 및 배포 준비
-
2023-03-23 작업 기록: 일본어 ITN 및 Qoo10 ASR 정렬
-
일본어 ASR 프로젝트 현황 및 전략 논의 (Day 627)
-
Day 588: 띄어쓰기 교정 실험 및 KAIST 채용 심사 기록
-
띄어쓰기 모델 변환 및 성능 테스트
-
Neural-ITN TensorRT 배포 시도 및 한계
-
일본어 ITN 포팅 착수 및 띄어쓰기 복원 알고리즘 고민
-
ReturnZero Day 488: 팀 기조 변경 및 NLP 전략 재정의
-
NLP 모델 오류 패턴 분석 및 개선 방안 (2022-10-28)
-
아서의 튜토리얼 - bmt 사용법
-
Day 303: 모델 이미지 재배포 및 TTS 연구 시작
-
gip-decoder 배포 및 TTS 아키텍처 검토
-
2026-05-21 업무: PVI 및 일본어 ASR 모델 개선 현황
-
ReturnZero Day 1743: PVI, 일본어 ASR 개선 및 신한 SDK 빌드
-
일본어 ASR 모델 (Cutoff) 벤치마킹 및 배포 준비
-
2025-09-16 일본어 모델 배포 및 설정 작업
-
VAD Dynamic Length 및 E2E ASR Config 변경 사항
-
일본어 ASR 모델 학습 및 데이터 전처리 진행 상황 (2024-07-15)
-
ReturnZero Day 1047: 일본어 ASR 모델 검증 및 성능 분석
-
기가코리아 개발 회의
-
ReturnZero Day 1650: 업무 현황 및 제로원 TTS TN 설계 초안
-
2025-01-06 업무 일지: 일본어 음성 데이터 소스 비교 및 파이프라인 이슈
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
신한은행 인프라 연동 및 라벨링 파이프라인 논의
-
ReturnZero 리서치 프로젝트 현황 (2022-01)
-
한국어 모델 업데이트 및 ITN 테스트 환경 준비
-
NLU 기술 동향 및 전시회 메모
-
Day 844. 2023-10-23
-
일본어 STT 모델 배포 준비 및 성능 평가 (Day 838)
-
Day 8. 2021-07-08
-
일본어 ASR 파인튜닝 준비 및 코드 수정
-
Day 699: dadumi 배포 및 일본어 ASR 평가
-
CTC Align 실패 현상 및 대안 탐색 (Day 672)
-
Day 665: ITN 모델 배포 장애 및 환경 정리
-
rt-dadumi aligner
-
Triton Ensemble 구현 및 NLP4STT 띄어쓰기 이슈
-
GEC 모델 ONNX 변환 및 NLP4STT 진행 상황
-
일본어 ITN 서비스 배포 및 테스트 진행 상황
-
Korean Spacing Algorithm Bug: Merged Phrase Overlap
-
GoP 발음 평가 및 NLP 과제 방향성 재정의
-
gRPC 연동 및 GoP 디버깅 (Day 290)
-
ReturnZero Day 1785: PVI, 일본어 ASR 개선 및 MWW 배포
-
ReturnZero Day 1756: PVI 및 일본어 ASR 개선 이슈
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
일본어 데이터 전사 이슈 및 두나무 로깅 아키텍처
-
2025-09-23 업무: 일본어 배포 및 서울소방 로그 분석
-
일본어 Cutoff 모델 배포 준비 및 Partial 응답 속도 검증
-
일본어 STT 모델 튜닝 및 팀벨 서비스 장애 대응
-
2024-07-21: ONNX 배포 실패 및 반기 회고
-
ReturnZero Day 1062: 워크샵 및 거대모델 대체 전략 논의
-
ReturnZero Day 1061: STT 엔지니어링 및 평가 현황
-
음성 데이터 전사 및 변환 작업 현황 (2024-05-22)
-
pysommers 데이터셋 전사 및 파일 매핑 작업 (2024-04-17)
-
Excalidraw Drawing (2026-01-01)
-
Triton-Kaldi 통합 테스트 및 팅커벨 사전 기능 설계 (Day 231)
-
ReturnZero Day 1623: STT 파이프라인 개선 및 인프라 자동화
-
RTZR-STT 패키징 자동화 및 모델 레지스트리 설계
-
Day 995. 2024-03-22
-
MWW VAD 임계값 수정 및 테스트
-
주소 인식 모델 (Address Model) 성능 분석 및 트러블슈팅
-
일본어 TMN 회의 및 팀벨 클러스터 작업
-
데이터 전략 논의 (Day 845)
-
일본어 데이터셋 전환 및 Quota 서비스 로직 수정
-
ITN 서비스 배포 및 VAD 통합 구성 검토
-
Day 657: Vito Worker 배포 및 rt-neural-itn Torch 의존성 제거
-
긴 입력 처리 아키텍처 검토 (Day 586)
-
2022-11-21 작업 기록: 한글 교정 로직 수정 및 Highlighter PoC 환경 설정
-
프로젝트 Bled 중단 및 SAC 프로젝트 집중
-
3i4k VTS 데이터 전처리 및 BMT 음성 전사 이슈
-
Day 300: 도커 배포, ivector 디버깅, gRPC 타임아웃 이슈
-
삼성 마지막 날: GRPC 서버 개발 및 TTS 요구사항 정의
-
ReturnZero Day 1762: PVI 및 일본어 ASR 개선 현황
-
2026-04-23 업무: PVI 및 일본어 ASR 개선
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-19)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-13)
-
ReturnZero Day 1645: 모델 레지스트리 및 웰컴용 STT 패키징 진행
-
ReturnZero Day 1643: 모델 레지스트리 구조화 및 전사 장애 분석
-
Whisper 차트 개선 및 배포 자동화
-
SIMS 모델 배포 및 게이트웨이 설정 작업
-
ReturnZero Day 1575: Series C 투자 유치 및 조직 위기 관리
-
2025-10-14 업무: 일본어 STT 튜닝 실험 및 제로원 제안서 초안
-
일본어 주소 인식 모델 배포 및 MWW STT 성능 검증
-
ReturnZero Day 1118: 음성 인식 전사 오류 및 WFST 디코더 호환성 문제
-
Day 1043: PII Redaction Filter 개발 및 On-Prem 모델 관리
-
Day 1022 (2024-04-18) - ReturnZero Daily Note
-
Timbel 전사 속도 최적화: VAD Trailing Time 조정
-
FreqAI 설정 및 커스텀 데이터 활용 가능성 탐구
-
SAC (Soft Actor-Critic) 강화학습 소개