이 노트는 재택근무 중 진행한 WFST(Weighted Finite State Transducer)를 위한 유한 오토마타(FSA) 공부 내용과, 화행(Act) 레이블링을 위한 회의 내용을 기록하고 있다. 회의에서는 전사록 기반의 액션 아이템 추출 및 고객 분석을 위한 유즈케이스를 논의하며, ‘좁고 정확한’ 모델이 사용자 경험에 더 유리하다는 결론을 내렸다. 또한 레이블링 아웃소싱보다는 리서치 팀의 결과물 수준을 입증하는 것이 중요함을 인지했다.
-
WFST 인터페이스 및 파인튜닝 진행 상황 (Day 383)
-
Day 390: 핵심성분 분석 및 WFST 테스트 진행
-
Day 385 (2022-07-20): WFST 개발 및 휴가 잔여일 계산
-
Day 369. 2022-07-04
-
WFST 엔진 구현 및 Commitment 작업 (Day 392)
-
약속) 성능 분석 및 정제 전략
-
WFST 목록화 및 의존성 구문 분석 탐색
-
FST 기반 분류기 구조 및 코드 리팩토링 (Day 435)
-
WFST 테스트 코드 및 규칙 개발 (Day 391)
-
Day 372 (2022-07-07) 작업 기록
-
WFST 최적화 및 결정화 알고리즘 검토
-
WFST 엔진 개발 및 토큰 태그 삽입 로직 개선 (Day 399)
-
옵셔널 구문 설계
-
WFST 코드 보완 및 분류 모델 성능 평가 (Day 400)
-
WFST 규칙 최적화 및 성능 평가 (Day 404)
-
WFST 엔진 구현 및 토큰 파싱 로직 설계
-
어미 처리 실험
-
GOP 개발 및 기술적 고민 (2022-07-13)
-
WFST 분류기 및 복합 클래스 우선순위 처리
-
pynini 학습 노트
-
Highlighter 구조 및 패턴 감별 방식 고찰
-
WFST 어미 인식 개선 및 gop-decoder S3 연동 계획
-
Rule-based NER 및 Semantic Role Labeling 구현 전략
-
미팅 요약 서베이 및 화행 분석
-
Day 931. 2024-01-18
-
스크립트 기반 자동 타이핑 기계 아이디어
-
ReturnZero: WFSTClassifier 리팩토링 및 명명 규칙 정리
-
대화 발화 병합 및 규칙 기반 분류 파이프라인 설계
-
라벨링 가이드라인 및 카테고리 정의 (Day 478)
-
rt-itn-jp 코드 모델 및 WFST 구현 계획
-
Composite rule: 해시 검증의 한계와 조합 폭발 문제
-
가치 있는 발화 추출의 어려움과 SAC 방향성 고민
-
NLP 라벨링 도구: 예측 및 비교 스크립트
-
수열 패턴 및 제곱근 근사 공식 탐구 (2019)
-
Fine-tuning 개념 정리
-
리팩토링 요소
-
ReturnZero: 컴포짓 클래스 및 라벨링 규칙 설계 고민
-
Day 428. 2022-09-01
-
Day 471. 2022-10-14
-
Day 448. 2022-09-21
-
3i4k 데이터셋을 활용한 화행분류 Feasibility 검토
-
Day 366. 2022-07-01
-
Day 301. 2022-04-27
-
Hypernetwork 구조 분석 및 한계점
-
Day 901. 2023-12-18
-
회의록 요약(Action Item 추출) 연구 서베이 및 난점 분석
-
Day 323. 2022-05-19
-
Day 264. 2022-03-21
-
Day 530. 2022-12-12
-
Day 490. 2022-11-02
-
Day 177. 2021-12-24
-
Day 166. 2021-12-13
-
Day 176. 2021-12-23
-
Day 329. 2022-05-25
-
Day 536. 2022-12-18
-
Day 15. 2021-07-15
-
Day 335. 2022-05-31
-
Day 364. 2022-06-29
-
Day 1105. 2024-07-10
-
Day 187. 2022-01-03
-
Day 160. 2021-12-07
-
ReturnZero Day 291: gRPC 로직 및 Ali-phone 정렬 디버깅
-
Day 497. 2022-11-09
-
Day 303: 모델 이미지 재배포 및 TTS 연구 시작
-
Apologize FP & Rule-Based Classifier Issues
-
Day 61 (2021-08-30) - ReturnZero 일지
-
Callabo 회의록 기능의 방향성 재고 및 우선순위 하향 조정
-
Day 306: GoP Decoder 문서화 및 Triton Backend 연구
-
ReturnZero Day 1118: 음성 인식 전사 오류 및 WFST 디코더 호환성 문제
-
VITO 요약 회의 및 RoBERTa 의도 분석 모델 논의
-
Day 875. 2023-11-23
-
Day 589. 2023-02-09
-
Day 1106. 2024-07-11 업무 요약
-
Day 820. 2023-09-28
-
Day 844. 2023-10-23
-
Day 461. 2022-10-04
-
Day 239. 2022-02-24
-
Day 966. 2024-02-22
-
Day 238. 2022-02-23
-
Day 315. 2022-05-11
-
Day 285. 2022-04-11
-
Day 693. 2023-05-24
-
다듬이 (Day 663)
-
Day 254. 2022-03-11
-
Day 9. 2021-07-09
-
Day 331. 2022-05-27
-
Day 247. 2022-03-04
-
Day 995. 2024-03-22
-
Day 19. 2021-07-19
-
ReturnZero Day 858: Confidence Score 적용 및 모델 변경
-
Day 8. 2021-07-08
-
Day 212. 2022-01-28
-
Day 527. 2022-12-09
-
Day 14. 2021-07-14
-
NLP 팀 회의 및 다음 작업 아이템 (2022-05-12)
-
Day 356. 2022-06-21
-
다듬이 마무리 (Day 702)
-
Day 455. 2022-09-28
-
Day 897: E2E 테스트, 데이터 증강 및 LM 적용 논의
-
SAC 통화 요약: 추출형 vs 생성형 요약 전략 및 평가 지표
-
Day 5. 2021-07-05
-
Day 1. 2021-07-01
-
기가코리아 개발 회의
-
Day 1036: 상태 확인 및 기술적 장애물
-
Qoo10 rtboost 구현 및 dadumi aligner 알고리즘 설계 고민
-
3i4k 데이터 정제 전략 및 SAC 프로젝트 아키텍처 정의
-
Day 6. 2021-07-06
-
오전 업무 스몰토크 (Day 597)
-
ReturnZero Day 495: 화자 분리 실패와 룰 기반 FP 감수
-
Vocab 실험 및 작업량 분석
-
Day 902: Audio Feature Extraction & Model Check
-
ReturnZero Day 686: 큐 병목 및 Worker 성능 저하 대응
-
ReturnZero Day 1147: AM 모델 학습 API 테스트
-
ReturnZero Day 532: Kiwi 모델 검증 및 일본어 숫자 태깅 규칙 분석
-
Day 30. 2021-07-30
-
Day 35. 2021-08-04
-
Day 34. 2021-08-03
-
Day 21. 2021-07-21
-
ReturnZero Day 427: SAC 로직 기획 및 Highlighter 구현 방향
-
ReturnZero Day 488: 팀 기조 변경 및 NLP 전략 재정의
-
Day 20. 2021-07-20
-
ReturnZero 분류 모델 성능 보정 실험 (Day 401)
-
ReturnZero Day 482: 비즈니스 통화 스크립트 검토 및 결과 비교 실험
-
ReturnZero 일본어 배포 및 문서 수정 (Day 1545)
-
Day 40. 2021-08-09
-
화행 분석을 위한 한국어 형태소 분석기 평가 및 규칙 기반 접근의 한계
-
Day 27. 2021-07-27
-
ITN 개발 및 에이전트 아키텍처 논의 (Day 680)
-
ReturnZero Day 1643: 모델 레지스트리 구조화 및 전사 장애 분석
-
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
-
Day 1022 (2024-04-18) - ReturnZero Daily Note
-
새 일본어 고객 (Day 786)
-
긴 입력 처리 아키텍처 검토 (Day 586)
-
다듬이 및 일본어 모델 처리 논의 (Day 642)
-
일본어 데이터 전처리 및 ITN 방침 (Day 623)
-
FastAPI 학습
-
일본어 데이터 정제 및 전처리 파이프라인 (Day 1562)
-
오프로딩: 속도 할당 및 유틸리티 함수 설계
-
ReturnZero Day 860: STT 모델 수정 및 성능 벤치마크
-
gRPC 연동 및 GoP 디버깅 (Day 290)
-
T4 GPU 환경에서 WFST 모델의 성능 측정 (Day 876)
-
Day 1104 (2024-07-09) - ReturnZero Daily Note
-
ReturnZero Day 814: 일본어 모델 학습 속도 문제 및 해결
-
ReturnZero Day 640: 텍스트 처리 파이프라인 리팩토링 및 세그멘테이션 이슈
-
KISA 프로젝트 준비 및 일본어 STT 모델 실험 (Day 1570)
-
Day 1043: PII Redaction Filter 개발 및 On-Prem 모델 관리
-
Recall) 이해 및 HuggingFace Transformers 학습 코드 분석
-
ReturnZero Day 1061: STT 엔지니어링 및 평가 현황
-
개인정보 수집 오남용 및 연구 방법론 검토 (2023-10-20)
-
Day 904: STT 학습 기능 논의 및 배포 준비 (2023-12-21)
-
일본어 ASR 얼라인 및 ITN 파이프라인 개발 (Day 635)
-
일본어 숫자 및 날짜 처리 로직 개선 (Day 533)
-
Day 365: VTS Trial 실험 결과 및 SAC 킥오프
-
ReturnZero Day 359: Python Client 완료 및 3i4k 데이터 FP 검증 시작
-
Day 847: Triton 테스트 환경 구축 및 특허 전략 논의
-
ITN 파이프라인 통합 및 일본어 정규화 작업 현황 (Day 602)
-
ReturnZero Day 1058: ASR 파이프라인 진행 상황 및 버그 수정
-
Day 800: 세팅 및 ITN 워커 스펙 변경
-
일본어 STT 개발계 배포 및 벤치마크 실행 기록 (Day 872)
-
Day 588: 띄어쓰기 교정 실험 및 KAIST 채용 심사 기록
-
2021-07-02 개발팀 워크샵 (Day 2)
-
Day 937: 다드미 버그 수정, 일본어 데이터 수집, 특허 보완
-
일본어 프로젝트 진행 상황
-
Day 1125. 2024-07-30 - 업무
-
Qoo10 일본어 ASR 파이프라인 및 엔진 성능 테스트 (Day 797)
-
Day 300: 도커 배포, ivector 디버깅, gRPC 타임아웃 이슈
-
ReturnZero Day 1575: Series C 투자 유치 및 조직 위기 관리
-
일본어 데이터 전처리 및 정제 규칙 (Day 790)
-
ITN-JP 숫자 변환 및 테스트셋 구축 (Day 535)
-
3i4k 모델 검증 및 VTS 테스트셋 평가 전략
-
GOP 디코더 디버깅 및 배포 일정 (Day 296)
-
GOP Online Decoder 테스트 및 디버깅 (Day 286)
-
쿠폰함 페어코딩 및 테스트 코드 작성 (Day 162)
-
쿠폰함 설계 및 AWS 아키텍처 검토 (Day 111)
-
Parquet 오디오 데이터 추출 및 전처리 스크립트
-
Pronaia STT 환경 설정 및 특허 미팅 기록 (Day 917)
-
ASR 파싱 및 인프라 요구사항 (Day 791)
-
SetFit 제로샷 분류 실험 및 ReturnZero 현황 (Day 545)
-
Day 282. 2022-04-08: GRPC 컴파일 시도 및 GoPRequest 파이프라인 설계
-
BLS 구현 및 배포 준비 (Day 694)
-
ReturnZero Day 832: 일본어 인식 실험 및 Prefix Decoder 평가
-
일본어 ASR 모델 실험 및 데이터 파이프라인 개선 (Day 811)
-
ReturnZero Day 764: 헬름차트 변경 및 배치 처리 아키텍처 논의
-
Day 516. 2022-11-28: Kiwi 모델 구축 API 화 및 콜라보 하이라이터 프로토타이핑
-
ReturnZero Day 1047: 일본어 ASR 모델 검증 및 성능 분석
-
신한카드 RFI 대응 및 STT 엔진 개발 현황 (Day 1034)
-
Confidence 구현
-
Day 699: dadumi 배포 및 일본어 ASR 평가
-
Day 610: 태스크 정리 (NLP4STT, 다듬이, 일본어 데이터)
-
ReturnZero Day 476: Message Commitment & Townhall Notes
-
리팩토링 시도: cdrewrite 및 transducer 기반 태그 삽입 성능 문제
-
3i4k 모델 성능 저하 분석 및 Pronaia 클라이언트 개발 현황
-
Conformer 모델 앙상블 및 BLS 통합 실험 (Day 910)
-
Triton-Kaldi 통합 및 Kaldi 레시피 구조 분석 (Day 190)
-
ReturnZero Day 1762: PVI 및 일본어 ASR 개선 현황
-
Day 125: 쿠폰함 구현 및 DB 연결 문제 해결
-
ReturnZero Day 1062: 워크샵 및 거대모델 대체 전략 논의
-
일본어 NLP 파이프라인 디버깅 및 코퍼스 구축
-
Triton-Kaldi 보고 및 CER 준비 (Day 236)
-
프로나이아 엔진 아키텍처 및 운영 이슈 (Day 715)
-
ITN 모델 배포 및 성능 튜닝 (Day 666)
-
ReturnZero Day 173: 테스트 전략 및 쿠폰함 작업
-
TD3 기반 주식 트레이딩 알고리즘 설계
-
Day 425: 환경 설정 문제 및 하이라이터 프로젝트 방향성
-
ReturnZero Day 1736: PVI 및 일본어 ASR 개선 현황
-
ReturnZero Day 628: 조직 개편 및 RTZR Rebuild #2 전략 회의
-
Day 657: Vito Worker 배포 및 rt-neural-itn Torch 의존성 제거
-
ReturnZero Day 594: 일본어 데이터 파이프라인 및 ITN 아키텍처 검토
-
GOP 계산 오류 디버깅 및 gRPC 서버 테스트 (Day 292)
-
Day 205: 오프라인 디코더 비교 실험 및 화자분리 장애 대응
-
ReturnZero Day 1765: PVI 및 일본어 ASR 모델 개선 현황
-
멀티뷰 학습 및 vLLM 서빙 엔진 탐색
-
Day 942: vito-worker 배포 및 STT 파이프라인 설정
-
STT 관련 고찰
-
쿠폰함 구현 및 DB 스키마 마이그레이션 (Day 167)
-
배포 워크플로우 논의 (Day 859)
-
Python Client 초기 배포 및 구조 검토 (Day 358)
-
ReturnZero Day 1749: PVI 및 일본어 ASR 개선 작업
-
Day 153: Jenkins 빌드 스크립트 계획 및 편두통 휴가
-
쿠폰함 구현 및 Factory 메소드 패턴 적용 (Day 135)
-
쿠폰함 서비스 개발 및 서버 코드 리팩토링 (Day 132)
-
Day 131: 쿠폰함 개발 및 동의 현황 쿼리 디버깅
-
Day 106: 지급형 쿠폰 기능 개발 및 알고리즘 학습
-
ASR), 인프라 혼돈
-
ReturnZero Day 700: 샌박 테스트 결과 및 일본어 STT 프로젝트 현황
-
GOP 프로젝트: ivector 문제 탐색 및 도커 배포 준비 (Day 299)
-
ReturnZero Day 1743: PVI, 일본어 ASR 개선 및 신한 SDK 빌드
-
Day 253: Vito-kaldi 리팩토링 및 Triton-kaldi 반영
-
쿠폰함 개발 및 기획 변경 (Day 161)
-
발표 스킬 및 연구 이슈 정리 (2019.12.17)
-
일본어 ASR 이슈 및 UBase 타운홀 요약
-
ReturnZero Day 1785: PVI, 일본어 ASR 개선 및 MWW 배포
-
ITN 개선 및 제로원 착수 준비
-
ReturnZero Day 1622: STT 파이프라인 개선 및 배포 인프라 작업
-
쿠폰함 서버 개발 및 Go 디자인 패턴 적용 (Day 138)
-
ReturnZero Day 133: 쿠폰함 구현 및 보상(Reward) 구조 설계
-
Day 665: ITN 모델 배포 장애 및 환경 정리
-
ReturnZero E2E 파이프라인 실행 순서 및 데이터 구조 분석
-
Day 203: Sommers Dataset Testing & Detokenization Issues
-
Day 117 (2021-10-25) - S-72 데이터 처리 및 쿠폰함 구현
-
Day 99: 쿠폰함 기능 확장 및 DB 설계 논의
-
ReturnZero Day 903: 모델 최적화 시도 및 성능 벤치마크
-
ReturnZero Day 582: 워크플로우 연동 및 Triton 배포 계획
-
Day 555: ONNX 모델 배포 및 환경 구성 고민
-
GoP 계산 파이프라인 분석 및 구현 계획 (Day 275)
-
Kaldi Feature Pipeline 및 iVector 추출 탐색 (Day 272)
-
ReturnZero Day 1756: PVI 및 일본어 ASR 개선 이슈
-
ReturnZero Day 147: 쿠폰함 개발 및 Go 에러 처리 패턴 고민
-
쿠폰 시스템 리팩토링 및 마이그레이션 (Day 174)
-
Day 137: Rails JSON Serialization Issue
-
Day 1426. 2025-05-26 - 업무
-
일본어 STT 모델 배포 준비 및 성능 평가 (Day 838)
-
Day 250: Rescore 구현 완료 및 Triton-Kaldi 환경 구축 삽질
-
ReturnZero Day 1645: 모델 레지스트리 및 웰컴용 STT 패키징 진행
-
TMN 회의: 일본어 4자리 숫자 인식 오류 분석
-
일본어 TMN 회의 및 팀벨 클러스터 작업
-
Triton 배포 및 모델 컴파일 파이프라인 정리 (Day 576)
-
2022-12-26 회사 근황 및 NLP 기술 검토
-
Day 168: 쿠폰함 작업 및 구조 변경 대기
-
Day 159: 쿠폰함 리뷰 및 서버 이슈 대응 (2021-12-06)
-
쿠폰함 구현 및 GoodProperties 설계 논의 (Day 134)
-
Day 121: 쿠폰함 구현 및 데드락 이슈 대응
-
Day 119: 쿠폰함 구현 및 DB 호환성 논의
-
최락권 박사님 세미나: 영상 품질 평가(QA) 및 시각 인지 모델
-
현택의 블록체인 기반 데이터 거래 모델 고찰
-
ReturnZero Day 837: 일본어 ASR 평가 및 엔진 개발
-
일본어 ASR 프로젝트 현황 및 전략 논의 (Day 627)
-
ASR 방향성 회의 및 3i4k 환경 구축 삽질
-
ReturnZero Day 1794: PVI 및 일본어 ASR 개선 현황
-
ReturnZero Day 1748: PVI 및 일본어 ASR 개선 작업
-
쿠폰함 모델 리팩터링 및 DB 설계 결정 (Day 169)
-
ReturnZero 모델 레지스트리 구조화 및 업무 현황 (Day 1633)
-
쿠폰함 기능 구현 및 DB 스키마 설계 (Day 163)
-
Day 16: 페어프로그래밍, SQL 실수 및 테스트 중심 개발
-
SIMS 고도화 및 K8s 환경 구축 작업 기록 (Day 1492)
-
Day 112: AWS Cost Data Ingestion & Coupon System
-
Day 104: 쿠폰함 설계 및 AWS 로그 중복 문제
-
코드 리뷰 진행
-
E2E ASR 모델 Triton 서빙 환경 구축 및 테스트 (Day 723)
-
SIMS 환경 설정 및 최적화 (Day 1202)
-
Triton-Kaldi 통합 테스트 및 팅커벨 사전 기능 설계 (Day 231)
-
프로나이아 패키지화 및 3i4k FP 검증
-
Day 126: 쿠폰 기능 개발 및 테스트 디버깅
-
Pronaia Engine 필터링 및 아키텍처 도식화 (Day 1044)
-
일본어 ASR 모델 디버깅 및 성능 비교 (Day 704)
-
Day 148: 쿠폰함 에러 처리 및 건강 이상 신호
-
ReturnZero Day 141: 쿠폰 기능 개발 및 버그 디버깅
-
어드민 개발 및 서버 접속 이슈
-
쿠폰함 서비스 상태 관리 및 로직 개선 (Day 128)
-
ReturnZero Day 958: 한자 인식 성능 평가 및 VAD 파라미터 튜닝
-
데이터 전략 논의 (Day 845)
-
ReturnZero Day 1745: PVI, 일본어 ASR 개선 및 Kubernetes 보안 검토
-
ReturnZero Day 1651: 업무 현황 및 제로원 TTS TN 정책 정의
-
MWW EKS 배포 장애 및 STT 모델 평가 이슈 (Day 1168)
-
Day 1380. 2025-04-10 - 업무
-
Day 946: YouTube 데이터 파이프라인 실험 및 Worker 테스트 이슈
-
ReturnZero Day 7: 서버 환경 세팅 및 DB 스키마 논의
-
CD 및 Transcriber 최적화 진행 상황
-
ReturnZero Day 1625: 웰컴용 Translator 패키징 및 일본어 모델 개선
-
3i4k VTS 데이터 전처리 및 BMT 음성 전사 이슈
-
압축 이슈 해결
-
Triton-Kaldi Offline Decoder 설계 및 HifiGAN 연구
-
dadumi lang 포함
-
ReturnZero Day 124: 쿠폰함 구현 및 기획 변경
-
ReturnZero 데이터셋 전처리 및 pysommers 파이프라인 디버깅
-
TTS 연구 파이프라인 정의 및 Project-K 협업 회고
-
Day 175: 쿠폰함 테스트 페어코딩 및 어드민 기능 확장
-
일본어 ASR 모델 훈련 성능 저하 관찰 (Day 1571)
-
Day 1015: 음성 전처리 교정 및 LLM 임베딩 학습
-
Day 1009: 팀벨 레이턴시 이슈 및 일본어 E2E 세그멘테이션
-
Day 491: E2E 음성 인식 서버 배포 장애 및 Kaldi 대체안 검토
-
Day 750: Helm Chart, Pronaia Proxy Logic, and Docker Build Tasks
-
Triton-Kaldi Offline Decoder 리팩토링 및 TTS 학습 진행 상황 (Day 259)
-
ReturnZero Day 1489: utterance 암호화 구현 및 Next Model(일본어) 탐색
-
Day 181: 배포 장애 대응 및 Triton 서버 학습 계획
-
Day 145: 쿠폰함 디버깅, 코드 프리즈 및 트랜스크라이버 성능 분석
-
Day 727: vitoworker 테스트 복구 및 PoC 준비
-
Kiwi 형태소 분석기 모델 학습 및 데이터 변환 프로세스
-
맞춤법 데이터 구조 및 토크나이징 전략 논의
-
일본어 ASR 모델 학습 및 데이터 전처리 진행 상황 (2024-07-15)
-
가독성 개선
-
CTC Align 실패 현상 및 대안 탐색 (Day 672)
-
MLOps 인프라 및 데이터 과학 공정 현황 (Day 251)
-
ReturnZero Day 1500: 현대캐피탈 고도화 및 utterance_save 암호화 구현
-
쿠폰 기능 확장 및 발급 로직 구현 (Day 105)
-
ReturnZero Day 1650: 업무 현황 및 제로원 TTS TN 설계 초안
-
일본어 STT 이슈
-
ITN 모델 최적화 및 데이터 전처리 작업 기록
-
프로나이아 프로젝트 및 인프라 운영 일지 (Day 1287)
-
Sims 설치 패키지 및 인프라 구성 정리 (Day 1185)
-
Day 155: 쿠폰함 재설계 결정 및 백준 알고리즘 고민
-
현대캐피탈 Triton 서버 빌드 및 성능 벤치마크 (Day 1112)
-
CD 삽질과 쿠폰함 어드민 구현 난관
-
ReturnZero 리빌딩 및 전략 회고 (Day 632)
-
Day 1143: 업무 및 기술적 문제 해결 기록
-
Day 1314 (2025-02-03) - 업무 및 조직 개편
-
테스트 진행 상황 (Day 965)
-
팀벨 개발 환경 설정 및 SIMS 배포 준비 (Day 959)
-
ITN 성능 시험 및 VAD 통합 테스트 진행 (Day 667)
-
Day 56: Sync Logic, AWS Infra Refactoring & Team Ops
-
Day 265: Vito-Kaldi 디코더 구조 분석 및 오프라인 디코딩 미완료
-
ReturnZero Day 1134: 에어갭 환경 구축 및 MWW 오류 대응
-
MMT 및 스트리밍 아키텍처 연구 방향성 (진홍 선배 논의)
-
Day 950: PTQ 세미나 및 작업 진행 상황
-
Day 852: 현대캐피탈 방문 및 use_vad_event 배포 준비
-
일본어 TTS 데이터 전처리 및 학습 구성안
-
주소 모델 개발 현황
-
NLP 문제 정의
-
Callabo STT 성능 개선 및 일본어 Qoo10 데이터 얼라인 전략
-
다듬이: Turn 기반 처리 파이프라인 재설계 및 Pandas 인덱스 문제
-
일본어 ASR 파이프라인 구축 및 Forced Alignment 문제 해결 시도
-
Day 58 (2021-08-27): 벨 프로젝트 인수 및 EFS 장애 대응
-
ITN 규칙 대응 및 Kiwi 기반 NLP 파이프라인 개선
-
Kiwi NLP 모델 빌딩 및 데이터 전처리 작업 기록
-
2022-06-20 워크샵 및 모델 실험 기록
-
GoP 발음 평가 및 NLP 과제 방향성 재정의
-
Project-K 지역락 이슈 및 모델 이미지 재퍼블리시
-
2025-10-16 업무: 일본어 STT 실험 및 KISA 프로젝트 준비
-
Day 1042 작업 기록: 데이터셋, MWW 버그, 인프라
-
일본어 ASR 모델 성능 검증 및 디버깅 (Day 708)
-
ReturnZero Day 1623: STT 파이프라인 개선 및 인프라 자동화
-
현대캐피탈 고도화: SIMS 배포 및 환경 설정 (Day 1465)
-
MWW EKS 환경 접속 및 배포 준비 (Day 1153)
-
ReturnZero STT 서비스 K8s 배포 및 Triton Server 연동 작업 (Day 748)
-
배치 구조 분석
-
BERT 모델의 ONNX 변환 및 Triton Server 배포 시도 (Day 559)
-
Torch 의존성 제거 및 Triton 이미지 배포 작업 (Day 658)
-
ReturnZero Day 1653: Speech Stack 개선 및 타운홀 전략 회고
-
ReturnZero Day 1644: 모델 레지스트리 구축 및 웰컴용 STT 패키징
-
Day 1590. 2025-11-06 - 업무 진행 상황
-
K8s 이슈)
-
Day 89: 데드락 해결 및 수지바오 로직 수정
-
일본어 ITN 테스트 및 데이터 문제 확인
-
TED 일본어 데이터셋(테스트용)
-
Day 72 (2021-09-10): 휴가 및 VA-589 작업, 세미나 준비
-
다듬이: 텍스트 처리 파이프라인 성능 최적화 및 병렬화 실험
-
rt-gec 토크나이저 이슈 및 일본어 ITN 학습 데이터 가이드라인
-
ASR-ITN 파이프라인 최적화 및 재학습 전략 논의
-
NLP 모델 오류 패턴 분석 및 개선 방안 (2022-10-28)
-
TTS 후순위 전환 및 ASR 집중 전략 수립 (2022-05-23)
-
Triton-Kaldi ASR 파이프라인 개선 및 스트레스 테스트 계획
-
Primary Voice Isolation 및 일본어 ASR 개선 과제
-
RTBoost Dataset VAD 오류 및 전처리 파이프라인 수정
-
Day 957: 주소모델 실험 및 Kubernetes GPU 환경 설정
-
팩맨 프로젝트 인프라 및 배치 작업 현황 (Day 1316)