2025년 1월 17일 업무 기록으로, 일본어 음성 인식(STT) 모델의 성능 벤치마킹과 파이프라인 설정 최적화가 주요 내용이다. 2080Ti와 3090 GPU 환경에서 다양한 일본어 테스트셋(hiragana, TEDxJP, CSJ 등)에 대해 CER, WER, SER 지표를 측정했다. 특히 WER(단어 오류율)이 99% 이상으로 매우 높게 나오는 현상이 관찰되었으며, 이는 단어 경계 처리나 평가 기준의 특수성으로 추정된다. 또한 팀벨 문의에 대응하여 VAD(Voice Activity Detection)의 active threshold를 기본값 0.95에서 0.88로 낮추어 해결하는 튜닝 과정을 기록하고 있다. 파이프라인 설정 파일(values.yaml)의 템플릿화(Jinja)와 커밋 전략에 대한 고민도 포함되어 있다.
-
일본어 STT 모델 벤치마킹 및 인프라 작업 기록 (2025-01-14)
-
일본어 STT 모델 튜닝 및 팀벨 서비스 장애 대응
-
2025-10-14 업무: 일본어 STT 튜닝 실험 및 제로원 제안서 초안
-
일본어 STT 개발계 배포 및 벤치마크 실행 기록 (Day 872)
-
VAD 임계값 튜닝 및 성능 평가 (2023-12-07)
-
Vito STT 성능 벤치마킹 및 환경 설정 기록 (2024-07-01)
-
일본어 STT 모델 배포 준비 및 성능 평가 (Day 838)
-
ASR 성능 벤치마크 및 SER 이슈 분석 (2024-07-18)
-
2025-10-15 업무 및 일본어 ASR 모델 평가
-
2024-09-19 업무: 일본어 STT 모델 튜닝 및 Prefix Decoder 디버깅
-
2025-10-16 업무: 일본어 STT 실험 및 KISA 프로젝트 준비
-
2025-10-13 업무: 일본어 STT 모델 검증 및 제로원 제안서 초안
-
2026-04-22 업무: PVI, 일본어 ASR 개선 및 Silero VAD 평가
-
ReturnZero Day 958: 한자 인식 성능 평가 및 VAD 파라미터 튜닝
-
2026-01-20 업무: 제로원 TTS 데이터 정제 및 일본어 STT 모델 배포 가이드
-
일본어 주소 인식 모델 배포 및 MWW STT 성능 검증
-
2026-01-23 업무: 제로원 집중 및 일본어 STT 개선
-
2025-11-05 업무: 오뚜기 모델 평가 및 L40S Whisper 일본어 성능 검증
-
VAD 임계값이 이름 학습 모델 성능에 미치는 영향 실험
-
일본어 프로젝트 진행 상황
-
RTZR 일본어 STT 개발 이력 및 인프라 현황
-
2024-11-28 업무 및 실험 기록
-
NLP 문제 정의
-
MWW VAD 임계값 수정 및 테스트
-
ReturnZero Day 837: 일본어 ASR 평가 및 엔진 개발
-
STT 성능 벤치마킹 및 특허 기술 아이디어 정리
-
ReturnZero Day 700: 샌박 테스트 결과 및 일본어 STT 프로젝트 현황
-
2026-05-21 업무: PVI 및 일본어 ASR 모델 개선 현황
-
ReturnZero Day 1047: 일본어 ASR 모델 검증 및 성능 분석
-
일본어 ASR 모델 디버깅 및 성능 비교 (Day 704)
-
일본어 STT 이슈
-
신한카드 RFI 대응 및 STT 엔진 개발 현황 (Day 1034)
-
KISA 프로젝트 준비 및 일본어 STT 모델 실험 (Day 1570)
-
일본어 ASR 모델 성능 벤치마크 및 문제점 (2023-09-25)
-
2025-09-23 업무: 일본어 배포 및 서울소방 로그 분석
-
NLU 기술 동향 및 전시회 메모
-
2023-09-07 작업 기록: 일본어 ASR 모델 학습 및 MWW 업무
-
음성 언어 식별 모델 평가 및 VAD 개발 계획
-
전처리 이슈
-
2026-01-14 업무 및 일본어 모델 배포 준비
-
데이터 전략 논의 (Day 845)
-
2025-12-10 업무: STT 패키징, VAD 필터링, 및 인프라 개편
-
주소 모델 개발 현황
-
Day 904: STT 학습 기능 논의 및 배포 준비 (2023-12-21)
-
2023-02-24 작업 기록: 일본어 STT 조사 및 통합 ITN 설계
-
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
-
일본어 철자전사 Align 및 신한은행 프로젝트 Kickoff
-
STT 관련 고찰
-
STT-LLM-TTS 챗봇 기술 스택 및 설정 초안
-
RTZR 일본어 STT 개발 이력 및 모델 레지스트리 구조
-
2026-01-16 업무: 두나무 STT 연동 장애 및 일본어 모델 개선
-
2026-01-21 업무: 제로원 TTS 데이터 정제 실패 및 일본어 STT 모델 개선 계획
-
ReturnZero Day 1622: STT 파이프라인 개선 및 배포 인프라 작업
-
일본어 ASR 모델 (Cutoff) 벤치마킹 및 배포 준비
-
2023 년 1 월~12 월 업무 회고 및 일본어 ITN 개발 이력
-
일본어 Cutoff 모델 배포 준비 및 Partial 응답 속도 검증
-
2025-09-16 일본어 모델 배포 및 설정 작업
-
TTS 모델 개선 및 S2 리빌드
-
RTFx 벤치마크 결과 (2023-10-09)
-
Callabo STT 성능 개선 및 일본어 Qoo10 데이터 얼라인 전략
-
일본어 ASR 파이프라인 설정 및 실험 기록
-
일본어 ASR 실험 및 Utterance Segmenter 개발 현황
-
ReturnZero Day 860: STT 모델 수정 및 성능 벤치마크
-
2024-11-29 업무 기록: 일본어 모델 개선 및 PII 버그 수정
-
MWW 일본어 배포 및 가독성 평가 실험 (2024-07-24)
-
삼성 마지막 날: GRPC 서버 개발 및 TTS 요구사항 정의
-
Day 699: dadumi 배포 및 일본어 ASR 평가
-
ASR 파싱 및 인프라 요구사항 (Day 791)
-
일본어 ASR 모델 실험 및 데이터 파이프라인 개선 (Day 811)
-
일본어 TTS 기반 학습 및 주소 전사 실험 노트
-
프로젝트 Bled 중단 및 SAC 프로젝트 집중
-
2026-04-23 업무: PVI 및 일본어 ASR 개선
-
새 일본어 고객 (Day 786)
-
2025-11-04 업무: L40S Whisper 실시간 성능 검증 및 MWW 모델 훈련
-
MWW 일본어 주소 모델 성능 개선 및 WFS 문제 진단
-
일본어 음성 인식 모델 테스트 결과 (2024-04-15)
-
S2 리빌드 문서화 및 RTZR STT 솔루션 아키텍처 정리
-
일본어 데이터셋 전환 및 Quota 서비스 로직 수정
-
2022-12-26 회사 근황 및 NLP 기술 검토
-
2026-01-13 업무 및 기술 노트
-
일본어 이름 모델 검증 및 T4 배포 준비
-
일본어 ASR 모델 평가 및 rt-itn 배포 기록
-
2024-07-22 업무 및 회고: 일본어 ASR 모델 평가 및 인프라 구축
-
일본어 NLP 화이트리스트 및 배포 기록
-
2023-08-08 작업 일지: 일본어 학습, MWW 배포, Dadumi
-
2026-05-15 업무: PVI, 일본어 ASR, MWW 배포 이슈
-
일본어 ASR 모델 훈련 성능 저하 관찰 (Day 1571)
-
일본어 코드모델 (파나소닉 모델명 인식)
-
Day 610: 태스크 정리 (NLP4STT, 다듬이, 일본어 데이터)
-
일본어 ASR 모델 성능 검증 및 디버깅 (Day 708)
-
2026-01-29 업무: 일본어 ASR 모델 개선 및 제로원 데이터 이슈
-
2026-02-03 업무: 일본어 ASR 모델 개선 및 Triton 배포 환경 최적화
-
2026-01-26 업무: 제로원 준비 및 일본어 ASR 개선
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
2026-02-02 업무: 일본어 ASR 모델 개선 및 제로원 데이터 처리
-
2026-01-15 업무 및 일본어 ASR 개선 계획
-
TTS 모델 개선 및 제로원 준비
-
2024-01-03 할 일: T4 변환 및 성능 평가
-
TTS 개선 및 S2 리빌드
-
TTS 개선 및 S2 리빌드
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
2026-01-28 업무: 일본어 ASR 모델 개선 및 데이터셋 구축
-
2026-01-27 업무: 제로원 TTS, 일본어 ASR 개선, 두나무 유지보수
-
2026-04-09 업무: PVI, 일본어 ASR 개선 및 TTS 관리 기능 개발
-
2026-02-08 업무: 일본어 ASR 모델 개선 및 웰컴 프로젝트 인프라 구축
-
2026-02-26 업무 일지: 일본어 ASR 개선 및 S2 리빌드
-
TTS 모델 개선 및 S2 리빌드
-
2026-05-14 업무 및 기술 이슈 요약
-
일본어 ASR 파인튜닝 준비 및 코드 수정
-
2026-01-19 업무: 제로원 TTS 데이터 파이프라인 및 일본어 ASR 모델 개선
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 계획
-
2026-05-28 업무 및 기술 이슈 요약
-
PVI 성능 개선 및 일본어 ASR 모델 이슈 분석
-
2026-01-22 업무 및 모델 개선 이슈
-
2026-03-25 업무 및 기술 이슈 요약
-
TTS 모델 개선 및 S2 리빌드 진행
-
PVI 및 일본어 ASR 모델 개선 현황 (2026-05-22)
-
ReturnZero Day 1794: PVI 및 일본어 ASR 개선 현황
-
ReturnZero Day 1785: PVI, 일본어 ASR 개선 및 MWW 배포
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-04)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-19)
-
TTS 모델 개선 및 S2 리빌드 진행 상황
-
PVI 최적화 및 일본어 ASR 모델 개선 현황 (2026-05-06)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-06)
-
ASR 모델 개선 현황: PVI, 일본어, MWW 화물맨
-
Primary Voice Isolation (PVI) 성능 평가 및 일본어 ASR 개선 계획
-
Primary Voice Isolation 및 일본어 ASR 개선 현황 (2026-03-31)
-
2026-03-09 업무 및 S2 리빌드 현황
-
PVI 모델 개선 및 일본어 ASR 이슈 분석
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-16)
-
Primary Voice Isolation 및 일본어 ASR 개선 과제
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-02-27)
-
일본어 ASR 이슈 및 UBase 타운홀 요약
-
PVI 성능 최적화 및 일본어 ASR 모델 개선 현황
-
ReturnZero Day 1756: PVI 및 일본어 ASR 개선 이슈
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-13)
-
ReturnZero Day 1762: PVI 및 일본어 ASR 개선 현황
-
ReturnZero Day 1749: PVI 및 일본어 ASR 개선 작업
-
ReturnZero Day 1765: PVI 및 일본어 ASR 모델 개선 현황
-
ReturnZero Day 1745: PVI, 일본어 ASR 개선 및 Kubernetes 보안 검토
-
ReturnZero Day 1743: PVI, 일본어 ASR 개선 및 신한 SDK 빌드
-
ReturnZero Day 1748: PVI 및 일본어 ASR 개선 작업
-
화물맨 ASR 도메인 특화 및 일본어 모델 개선 현황
-
2026-01-30 업무: 일본어 ASR 개선, 제로원 데이터 처리, 두나무 인프라 이슈
-
ReturnZero Day 1625: 웰컴용 Translator 패키징 및 일본어 모델 개선
-
ReturnZero Day 1736: PVI 및 일본어 ASR 개선 현황
-
ReturnZero Day 1650: 업무 현황 및 제로원 TTS TN 설계 초안
-
ITN 개선 및 제로원 착수 준비
-
미래에셋 방문 및 일본어 데이터 준비 작업
-
2026-01-02 업무 및 제로원 TTS TN 프로젝트 킥오프
-
일본어 ASR 프로젝트 현황 및 전략 논의 (Day 627)
-
Primary Voice Isolation(PVI) 및 신한은행 다국어 STT 대응 현황
-
ReturnZero Day 1645: 모델 레지스트리 및 웰컴용 STT 패키징 진행
-
현대캐피탈 Numberplate 모델 장애 진단 및 일본어 T4 모델 준비
-
A-15 조합 5차 총회 주요 안건 및 현황
-
rtzr-stt Pacman 개선 및 VAD 필터 기술 검토
-
2024-07-19 ASR 모델 벤치마크 결과 (Alphanumeric)
-
Day 1106. 2024-07-11 업무 요약
-
Qoo10 일본어 ASR 파이프라인 및 엔진 성능 테스트 (Day 797)
-
RTZR 일본어 ASR 개발 이력 및 모델 레지스트리 구조
-
일본어 개발계 배포 준비 및 장애 대응
-
ASR 모델 성능 평가 결과 (2023-10-02)
-
T4 빌드 및 일본어 NLP 처리 방안
-
비즈니스 현황 (2025-10-23)
-
ReturnZero STT 솔루션 개발 및 모델 레지스트리 구조화
-
Primary Voice Isolation (PVI) 파이프라인 개선 및 일본어 ASR 모델 이슈
-
ASR 모델 개선 현황: PVI, 일본어, 화물맨 도메인
-
Primary Voice Isolation(PVI) 및 일본어 ASR 개선 현황
-
ASR 모델 개선 및 프로젝트 진행 현황 (2026-05-07)
-
ReturnZero 모델 레지스트리 구조화 및 업무 현황 (Day 1633)
-
rtzr-stt 파이프라인 개선 및 STT 인식 오류 분석 (2025-11-12)
-
한국어 TTS 정규화 모델 개발 및 일본어 ASR 개선 현황
-
S2 리빌드 문서화 및 다국어 RTFx 측정 환경 구축
-
ReturnZero 일본어 배포 및 문서 수정 (Day 1545)
-
일본어 음성 전사 파이프라인 설계 및 고려사항
-
일본어 TMN 회의 및 팀벨 클러스터 작업
-
출장 정리 및 이름 모델 개선 계획 (2023-11-14)
-
ReturnZero Day 1061: STT 엔지니어링 및 평가 현황
-
일본어 ASR 파이프라인 구축 및 Forced Alignment 문제 해결 시도
-
Primary Voice Isolation(PVI) 및 신한은행 다국어 ASR 대응 현황
-
PVI 최적화 및 일본어 ASR 모델 개선 현황 (2026-04-29)
-
일본어 음성 인식(ASR) 전사 파이프라인 디버깅 및 경량화 시도
-
Qoo10 전사 오류 원인 분석 및 카타카나 모델 벤치마크
-
ReturnZero 프로젝트 관련 기술 링크 모음
-
주소 인식 모델 서빙 방식 결정: ONNX Dynamic vs TRT
-
T4 GPU 환경에서 WFST 모델의 성능 측정 (Day 876)
-
현대캐피탈 배포 및 제로원 프로젝트 킥오프
-
모델 서빙 아키텍처 논의
-
SIMS 이슈 발생
-
일본어 ASR 모델 학습 및 데이터 전처리 진행 상황 (2024-07-15)
-
주소 교정 (Address Correction)
-
PVI 모델 최적화 및 일본어 ASR 개선 현황 (2026-05-27)
-
2025-01-06 업무 일지: 일본어 음성 데이터 소스 비교 및 파이프라인 이슈
-
VAD Dynamic Length 및 E2E ASR Config 변경 사항
-
주소 인식 모델 (Address Model) 성능 분석 및 트러블슈팅
-
일본어 TTS 데이터 전처리 및 학습 구성안
-
일본어 NLP 파이프라인 및 데이터셋 전처리 작업 기록
-
다국어 RTFx 성능 측정 및 S2 리빌드 현황
-
Istio 네트워크 문제 조사
-
Day 1009: 팀벨 레이턴시 이슈 및 일본어 E2E 세그멘테이션
-
2025-08-29 업무: 현대캐피탈 고도화 및 일본어 SIMS 배포 준비
-
Primary Voice Isolation 평가 및 일본어 ASR 개선, 서비스 채널 용량 산정
-
TTS 인프라 개선 및 웰컴저축은행 프로젝트 킥오프
-
2024-07-21: ONNX 배포 실패 및 반기 회고
-
가독성 개선
-
TED 일본어 데이터셋(테스트용)
-
ReturnZero Day 832: 일본어 인식 실험 및 Prefix Decoder 평가
-
ReturnZero Day 1644: 모델 레지스트리 구축 및 웰컴용 STT 패키징
-
STT 실시간 엔진 배포 가이드 및 데이터셋 전처리 현황
-
qoo10 일본어 서버 재가동 및 헬름차트 설정
-
2025-09-12 업무 우선순위: 일본어 배치 및 GPT 작업
-
일본어 데이터셋 구축 및 전사 파이프라인 디버깅
-
ReturnZero Day 903: 모델 최적화 시도 및 성능 벤치마크
-
일본어 데이터 전사 비교 및 정규화 로직 수정
-
2024-11-27 작업 기록: 일본어 BMT 실험 및 Pronaia 서버 리팩토링
-
Primary Voice Isolation 연구 계획 및 VAD 개선 방향
-
Day 942: vito-worker 배포 및 STT 파이프라인 설정
-
일본어 관련 의심 단어 목록 및 정제 규칙
-
S2 리빌드 및 스택빌더 개발 현황 (2026-02-28)
-
RTZR-STT 모델 레지스트리 구조화 및 배포 자동화 계획
-
GPT-SoVITS 감정 표현의 무작위성 및 Gemini 3 평가
-
Pronaia STT 환경 설정 및 특허 미팅 기록 (Day 917)
-
2023-03-04 작업 진행 사항 (NLP4STT, 일본어 데이터셋, rt-dadumi)
-
일본어 숫자 및 날짜 처리 로직 개선 (Day 533)
-
BMT 엔진 벤치마크 오류 및 Helm 템플릿 수정
-
Pacman 차트 개편 및 현대캐피탈 VAD 이슈 대응
-
mel2vec 영숫자 인식 성능 검증 및 패딩 실험 결과
-
다듬이 및 일본어 모델 처리 논의 (Day 642)
-
모델 레지스트리 구조화 및 배포 자동화
-
현대캐피탈 Triton 서버 빌드 및 성능 벤치마크 (Day 1112)
-
RTBoost Dataset VAD 오류 및 전처리 파이프라인 수정
-
2025-09-08 업무: 일본어 SIMS 배포 및 현대캐피탈 고도화 준비
-
ReturnZero Day 1489: utterance 암호화 구현 및 Next Model(일본어) 탐색
-
Day 1426. 2025-05-26 - 업무
-
MWW 한국어 STT 배포 및 SIMS Backend 아키텍처 검토
-
일본어 가타카나 인식에서 음절 절단 문제 분석
-
일본어 ASR 얼라인 및 ITN 파이프라인 개발 (Day 635)
-
2024-05-29 업무 및 기술 작업 기록
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
TMN 회의: 일본어 4자리 숫자 인식 오류 분석
-
Timbel 전사 속도 최적화: VAD Trailing Time 조정
-
일본어 데이터 전처리 및 정제 규칙 (Day 790)
-
2023-03-23 작업 기록: 일본어 ITN 및 Qoo10 ASR 정렬
-
TTS 기술 이슈 (2026-05-19)
-
일본어 데이터 정제 및 전처리 파이프라인 (Day 1562)
-
polyglot-ko 서빙 준비도
-
2025-09-10 업무 우선순위 및 이슈 (일본어 배포, dadumi, 현대캐피탈)
-
2025-01-21 업무 및 프로젝트 현황
-
2023-08-22 작업 일지: 일본어 데이터 전처리 및 Pronaia 테스트 환경 구축
-
다듬이: 일본어 ITN 및 배포 준비
-
2025-11-11 업무 및 기술 노트
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
일본어 NLP 데이터 정제 및 운영 라이선스 발급
-
ReturnZero Day 1623: STT 파이프라인 개선 및 인프라 자동화
-
ReturnZero STT 오프라인 설치 및 Kubespray 자동화 프로세스
-
일본어 음성 인식 파인튜닝: 문자셋 재정의 및 데이터 혼합 비율 조정
-
ReturnZero Day 1651: 업무 현황 및 제로원 TTS TN 정책 정의
-
2025-02-10 업무 및 리서치 정리
-
ITN 개발 및 에이전트 아키텍처 논의 (Day 680)
-
ITN 성능 시험 및 VAD 통합 테스트 진행 (Day 667)
-
ReturnZero 리서치 프로젝트 현황 (2022-01)
-
일본어 Neural ITN 및 4090 환경 빌드 시도
-
Primary Voice Isolation(PVI) 평가 환경 구축 및 신한 SDK 16kHz 대응
-
배포 테스트 (2024-09-11)
-
2023-07-27 작업 계획: 일본어 모델 배포 및 Triton 설정
-
2025-09-11 업무 진행 상황: 일본어 TMN, dadumi, 현대캐피탈
-
2025-09-02 업무: 일본어 T4, 현대캐피탈 고도화, utterance 암호화
-
Day 937: 다드미 버그 수정, 일본어 데이터 수집, 특허 보완
-
2024-12-03 작업 일지: 시스템 튜닝 및 배포
-
2025-01-08 업무 및 기술 노트
-
ASR 성능 데이터
-
리턴제로: 오디오 SNS 및 아바타 메타버스 프로젝트 구상
-
Day 901. 2023-12-18
-
일본어 데이터셋 평가 및 온프레미스 환경 설정
-
ASR 방향성 회의 및 3i4k 환경 구축 삽질
-
2025-08-25 업무: 현대캐피탈 TTS 장애, utterance 암호화, 일본어 모델 디버깅
-
Day 1380. 2025-04-10 - 업무
-
ReturnZero Day 814: 일본어 모델 학습 속도 문제 및 해결
-
일본어 ASR 데이터 전처리 및 Pronaia 메시지 구조 정의
-
rt-gec 토크나이저 이슈 및 일본어 ITN 학습 데이터 가이드라인
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
Day 946: YouTube 데이터 파이프라인 실험 및 Worker 테스트 이슈
-
ITN 성능 벤치마크 및 토큰화 버그 분석
-
일본어 데이터 전처리 및 ITN 방침 (Day 623)
-
띄어쓰기 모델 변환 및 성능 테스트
-
S2 리빌드 및 스택빌더(S2 Rebuild & StackBuilder) 개발 현황
-
RTZR-STT 패키징 자동화 및 모델 레지스트리 설계
-
BMT Pronaia VAD 오류 해결 및 seq2seq 학습 기록
-
일본어 주소 인식 시스템 개선 및 파인튜닝 전략
-
KISA STT 솔루션 설치 및 환경 구성 (Day 1573)
-
PII 영향 분석)
-
ReturnZero Day 532: Kiwi 모델 검증 및 일본어 숫자 태깅 규칙 분석
-
MWW EKS 배포 장애 및 STT 모델 평가 이슈 (Day 1168)
-
2025-05-29 업무 및 타운홀 기록
-
통합 ITN 인터페이스 통일 및 일본어 프로젝트 일정 조정
-
ITN 성능 병목 분석 및 일본어 전사 개선 방향
-
2025-11-07 업무 진행 상황: MWW 모델 평가 및 rtzr-stt 개선
-
Conformer 모델 앙상블 및 BLS 통합 실험 (Day 910)
-
일본어 ITN 테스트 및 데이터 문제 확인
-
ITN 서비스 배포 및 VAD 통합 구성 검토
-
현대캐피탈 OS 변경 대응: STT 및 라이선스 서버 디렉토리 이관 목록
-
2023-05-12 일본어 모델 학습 및 얼라인, ITN 서비스화 진행 상황
-
ITN 파이프라인 통합 및 일본어 정규화 작업 현황 (Day 602)
-
ReturnZero Day 594: 일본어 데이터 파이프라인 및 ITN 아키텍처 검토
-
신한카드 프로젝트: STT 이슈 대응 및 PII 개선 회고
-
주소 인식 모델 성능 검증 및 Triton 배포 전략
-
ITN 모델 배포 및 성능 튜닝 (Day 666)
-
2022-06-20 워크샵 및 모델 실험 기록
-
S2 리빌드 및 다국어 RTFx 측정 (2026-03-11)
-
ASR 전사 결과 평가용 프롬프트 영문화 및 간소화
-
하코네 여행 경비 및 일본어 학습
-
2024-08-05 업무 및 인프라 설정 기록
-
차트 개편
-
오전 업무 스몰토크 (Day 597)
-
Day 1590. 2025-11-06 - 업무 진행 상황
-
현대캐피탈 고도화 및 일본어 모델 개발 진행 상황 (Day 1524)
-
2024-05-17 업무 기록: 키워드 부스트 모델 배포 및 개발 환경 설정
-
일본어 Pronaia 배포 및 ITN 파이프라인 실험
-
S2 리빌드 및 스택빌더 이슈 해결
-
Day 1043: PII Redaction Filter 개발 및 On-Prem 모델 관리
-
Stable Diffusion 모델 체크포인트 링크
-
Homura-Dan 라이센스 서버 아키텍처 및 RTFx 성능 벤치마크
-
일본어 ITN 서비스 배포 및 테스트 진행 상황
-
2025-01-20 업무 및 2024 하반기 회고
-
Day 847: Triton 테스트 환경 구축 및 특허 전략 논의
-
gip-decoder 배포 및 TTS 아키텍처 검토
-
RTZR-STT 서비스 Istio 네트워크 정책 및 장애 조치 실험 (2024-10-30)
-
Pronaia Engine Keyword Boosting 모델 전사 테스트 및 배포 준비
-
일본어 주소 인식 시스템 개선 및 파인튜닝 전략
-
일본어 데이터 전사 이슈 및 두나무 로깅 아키텍처
-
2025-09-26 현대캐피탈 현장 방문 및 STT 서비스 상태 확인
-
2025-01-16 업무 및 프로젝트 현황
-
2024-11-04 업무 및 기술 이슈 요약
-
일본어 NLP 파이프라인 디버깅 및 코퍼스 구축
-
현대캐피탈 차량번호 인식 모델 파인튜닝 및 SIMS 일본어 환경 구축
-
인프라 구축 현황
-
Whisper 인프라 개선, 브라우저 DNN 탐색
-
Day 1125. 2024-07-30 - 업무
-
ITN Triton 통합 배포 및 스레드 풀 문제
-
음성 분리(Speech Separation) 프로젝트 기술 면접 및 모델 경량화 검토
-
MWW 한국어 SIMS 평가 및 커넥션 릭 재현 테스트
-
테스트 진행 상황 (Day 965)
-
NLP 팀 회의 및 다음 작업 아이템 (2022-05-12)
-
stamcord 아키텍처 개선 및 하드웨어 프로젝트 메모
-
인텔 프로젝트 현황
-
2025-09-19 업무: 송세화 면접 준비 및 Dadumi Aligner 디버깅
-
CPU VAD 모델 웜업(Warmup) 및 TensorRT 최적화 실험 결과
-
2025-08-27 업무 우선순위 및 기술 이슈
-
ReturnZero STT 서비스 운영 및 신한은행 다국어 프로젝트 준비
-
2024-09-24 업무 진행 사항: 주소 모델 배포 및 시스템 테스트
-
유튜브 자막 전사 데이터 손실 및 저장소 오류
-
dadumi한테 어떻게 task를 줄건데
-
통합 ITN 및 S2 Phase 1 진행 상황 (2023-06-05)
-
Primary Voice Isolation (PVI) 연구 계획서
-
두나무 업무 및 차트 리팩토링 계획 (Day 1338)
-
dadumi lang 포함
-
음성 데이터 전사 및 변환 작업 현황 (2024-05-22)
-
일본어 처리 이슈
-
ReturnZero STT 서비스 K8s 배포 및 Triton Server 연동 작업 (Day 748)
-
dadumi-whisper 파이프라인 개선 및 현대캐피탈 업무
-
2025-09-30 업무 및 시스템 복구 현황
-
MWW 배포 및 ASR 파이프라인 디버깅 (2024-03-12)
-
Day 820. 2023-09-28
-
ITN 모델 최적화 및 데이터 전처리 작업 기록
-
한국어 TTS 텍스트 정규화(TN) 경량 모델 개발 진행 상황 (2026-02)
-
ReturnZero Day 1643: 모델 레지스트리 구조화 및 전사 장애 분석
-
SIMS 모델 배포 및 게이트웨이 설정 작업
-
2025-06-09 업무 진행 사항 (SIMS, Stack-Builder, 현대캐피탈)
-
2025-02-06 업무 및 기술 검토 (팩맨, 두나무, MWW)
-
일본어 ITN(숫자 읽기) 디버깅 및 워커 개발
-
2022-12-13 작업 기록: NLP 파이프라인 디버깅 및 일본어 ITN 통합
-
차트 개선
-
2024-09-25 업무 및 기술 이슈 요약
-
2025-08-20 업무: 현대캐피탈 고도화, 암호화 구현, Next Model 환경 구축
-
2023-08-28 일일 작업 기록: 일본어 데이터 분석, 현대캐피탈 장애 대응, GPU Operator 설치
-
2025-09-25 업무 및 Docker Hub 장애 대응
-
SIMS 일본어 설치 및 현대캐피탈 모델 고도화 진행 상황
-
2025-08-11 업무: 현대캐피탈 고도화, utterance_save 암호화, Next Model, 신한카드
-
한국어 배포 준비
-
MWW 한국어 개발계 배포 및 기술적 장애 대응 (2023-11-15)
-
Trt) 시도 및 실패 기록
-
TTS 후순위 전환 및 ASR 집중 전략 수립 (2022-05-23)
-
TTS 연구 파이프라인 정의 및 Project-K 협업 회고
-
RAPA 방송영상 AI 학습용 데이터 구축 과제 킥오프 및 Pacman Stack Builder 현황
-
2024-09-30 업무 일지: 신한카드 및 서울소방재난본부 프로젝트 진행 상황
-
2025-07-09 업무: RAPA 발표자료 및 프로젝트 수정
-
일본어 ITN 포팅 착수 및 띄어쓰기 복원 알고리즘 고민
-
2025-08-28 업무 우선순위 및 기술 이슈
-
2025-03-05 업무 진행 사항 및 TODO
-
Day 1314 (2025-02-03) - 업무 및 조직 개편
-
SIMS 헬름 구성 및 파이프라인 자동화 고민
-
한국어 모델 업데이트 및 ITN 테스트 환경 준비
-
Pronaia-Engine 코드 폴리싱 및 Triton Mel 성능 검증
-
다듬이 마무리 (Day 702)
-
NLP4STT 프로젝트 마무리 및 팀원 이탈 회고
-
Whisper 차트 개선 및 배포 자동화
-
MWW 사업 리뷰 및 오뚜기 음성 인식 이슈 대응
-
팀벨(Timbel) 평가(Eval) 시스템 디버깅 및 인프라 설정
-
ReturnZero Day 1058: ASR 파이프라인 진행 상황 및 버그 수정
-
Kiwi 형태소 분석기 학습 데이터 확보 및 일본어 ITN 개발 현황
-
과제
-
2025-03-10 업무 진행 사항 (팩맨, 두나무)
-
2024-12-12 업무 및 신한카드 아이쏠라 배치 준비
-
두나무 업무 진행 사항 (2025-04-07)
-
2024-08-14 업무 및 프로젝트 진행 상황
-
일본어 ITN (Inverse Text Normalization) 처리 규칙 및 문제점
-
2025-08-22 업무: 현대캐피탈 고도화, 암호화 구현, Next Model 디버깅
-
rt-dadumi aligner
-
CD 및 Transcriber 최적화 진행 상황
-
NLP 모델 오류 패턴 분석 및 개선 방안 (2022-10-28)
-
아서의 튜토리얼 - bmt 사용법
-
Day 365: VTS Trial 실험 결과 및 SAC 킥오프
-
Day 323. 2022-05-19
-
Day 212. 2022-01-28
-
타운홀)
-
Gemma2 기술 검토
-
Day 1104 (2024-07-09) - ReturnZero Daily Note
-
멀티뷰 학습 및 vLLM 서빙 엔진 탐색
-
일본어 주소 인식 시스템 개선 및 파인튜닝 전략
-
2025-09-03 업무: SIMS 일본어화 및 현대캐피탈 고도화 진행 상황
-
2025-06-10 업무 기록: SIMS 빌드 환경, Pacman 모델 평가, 신한카드 컨테이너 오류
-
2025-03-31 업무 및 조직 현황
-
두나무 프로젝트 업무 진행 상황 (2025-04-04)
-
Day 1143: 업무 및 기술적 문제 해결 기록
-
2024-08-13 업무 및 프로젝트 진행 상황
-
Day 800: 세팅 및 ITN 워커 스펙 변경
-
Dadumi 배포 및 샌드박스 테스트 진행 상황 (Day 695)
-
Day 61 (2021-08-30) - ReturnZero 일지
-
SetFit 제로샷 분류 실험 및 ReturnZero 현황 (Day 545)
-
Day 490. 2022-11-02
-
ReturnZero Day 359: Python Client 완료 및 3i4k 데이터 FP 검증 시작
-
2025-07-15 업무: 현대캐피탈 고도화 및 rtzr-stt 운영 준비
-
2025-07-11 업무 진행 상황 (RAPA, 현대캐피탈, Pronaia)
-
2025-05-27 업무 진행 사항 (두나무, 신한카드, 팩맨 빌더)
-
2025-04-17 업무 진행 상황 및 과제 논의
-
2025-08-21 업무: 현대캐피탈 고도화, utterance 암호화, Next Model 배포
-
MWW 배포 회고 및 테스트 데이터셋 구성 전략
-
PRONAIA BMT 서비스 배포 및 테스트 데이터 준비 현황
-
Day 902: Audio Feature Extraction & Model Check
-
ASR-ITN 파이프라인 최적화 및 재학습 전략 논의
-
VTS201020 데이터셋의 압축 포맷 및 배치 크기에 따른 CER 불안정성 분석
-
Triton Custom Backend 학습 계획 및 모델 웜업 개념 정리
-
S2 리빌드 및 스택빌더 문서화 진행 상황
-
제로원 프로젝트 진행 상황 및 기술적 이슈 (2026-01-12)
-
2025-06-17 업무 진행 사항 (Pacman, 두나무, SIMS)
-
SIMS 0.4.0 배포 시험 및 설정 검토
-
Triton 이미지 교체 및 Pronaia Engine 배포 작업
-
Kubernetes 클러스터 보안 점검 및 Day 1199 업무 기록
-
ReturnZero Day 1118: 음성 인식 전사 오류 및 WFST 디코더 호환성 문제
-
Day 1022 (2024-04-18) - ReturnZero Daily Note
-
Pronaia 온프레미스 세미나 준비 및 데이터 파이프라인 문제 해결
-
기가코리아 개발 회의
-
2025-11-21 업무: 두나무 인프라 장애, Pacman 차트 개선, MWW 대응
-
2025-08-13 업무 진행 상황: 현대캐피탈, utterance 암호화, Next Model 디버깅
-
Day 966. 2024-02-22
-
팀벨 개발 환경 설정 및 SIMS 배포 준비 (Day 959)
-
BMT 모델 테스트 및 인프라 설정 (2024-01-05)
-
ITN 배포용 메트릭 설정 및 K8s 테스트베드 구축
-
Sandbox BMT 테스트 환경 구성 및 설정
-
2023-07-05 작업 계획 및 MWW 연동 이슈 해결
-
fp16 테스트 실패 및 배포 작업 기록
-
ReturnZero Day 582: 워크플로우 연동 및 Triton 배포 계획
-
pysommers 개발 진행 상황 및 반성 (2023-01-03)
-
Day 372 (2022-07-07) 작업 기록
-
Pysommers BMT CER 계산 및 화자 구분 세미나 노트
-
Day 303: 모델 이미지 재배포 및 TTS 연구 시작
-
Day 187. 2022-01-03
-
현대캐피탈 차량번호 인식 모델 고도화 및 데이터 필터링
-
2025-04-30 업무: 두나무 장애 및 농협 PoC 진행
-
프로나이아(Pronaia) 전사 요약 기능 개발 및 Kubespray 정리
-
MWW EKS 환경 접속 및 배포 준비 (Day 1153)
-
ReturnZero 데이터셋 전처리 및 pysommers 파이프라인 디버깅
-
Day 1055: 전사 품질 필터링 및 Triton E2E 디코딩 오류 분석
-
Day 1015: 음성 전처리 교정 및 LLM 임베딩 학습
-
2025-02-05 일지: 업무, 투자 리밸런싱, 개발 및 개인 기록
-
2025-11-03 업무: 두나무 Audit, 오뚜기 모델, 부산소방 연동
-
2025-06-16 업무 진행 사항 (Pacman, 두나무, SIMS, MWW)
-
2025-06-04 업무 진행 상황: 두나무, SIMS, zLogger, 현대캐피탈 및 영업 현황
-
OpenSearch
-
gRPC Insecure 연결 문제 및 STT API 통합 문의
-
mww 운영계 배포 아키텍처 및 구성 요소
-
Day 875. 2023-11-23
-
Qoo10 데이터 정규화 및 장애 대응 기록
-
CTC Align 실패 현상 및 대안 탐색 (Day 672)
-
Day 589. 2023-02-09
-
Triton 배포 및 모델 컴파일 파이프라인 정리 (Day 576)
-
Python Client 초기 배포 및 구조 검토 (Day 358)
-
Project-K 지역락 이슈 및 모델 이미지 재퍼블리시
-
Day 300: 도커 배포, ivector 디버깅, gRPC 타임아웃 이슈
-
MWW-TMN 배포 및 인프라 문제 해결 (2025-10-21)
-
현대캐피탈 고도화 이슈 대응 및 utterance_save 암호화 구현
-
Day 14. 2021-07-14
-
VITO 요약 회의 및 RoBERTa 의도 분석 모델 논의
-
2024-09-04 업무 진행 상황 및 아이쏠라 운영계 준비
-
ReturnZero Day 1147: AM 모델 학습 API 테스트
-
pysommers 데이터셋 전사 및 파일 매핑 작업 (2024-04-17)
-
2025-11-18 업무: Pacman 개선, MWW 점검, AI Agent 방향성 고민
-
2025-06-05 업무: SIMS 로깅, dadumi 에러 분석, 현대캐피탈 현행화 준비
-
2025-04-03 업무 진행 사항 (두나무, 농협은행 PoC, Dan 인수, Builder)
-
2025-08-12 업무 진행 상황: 현대캐피탈, utterance 암호화, Next Model, 신한카드, 쿠팡 PoC