ASR 모델 성능 평가 결과 (2023-10-02)

Source

Field Notes/ReturnZero/Daily Notes/Day 823. 2023-10-02.md

Summary

2023년 10월 2일 기록된 음성 인식(ASR) 모델의 테스트 결과입니다. 숫자, 영숫자, 한자, 가타카나 등 다양한 문자 유형별 CER(Character Error Rate)과 SER(Sentence Error Rate)을 비교 분석하였으며, 가타카나와 숫자 영역에서 상대적으로 낮은 오류율을 보였습니다. 또한 PyTorch 체크포인트를 ASR ckpt 형식으로 변환하는 명령어 실행 기록이 포함되어 있습니다.

Key Points

다양한 문자 유형(숫자, 영숫자, 한자, 가타카나)에 대한 ASR 모델 성능 지표(CER, SER, RTFx) 비교
가타카나(katakana)와 숫자(number) 테스트에서 상대적으로 낮은 CER(5~7%) 기록
한자(kanji) 및 영숫자(alphanumber) 테스트에서 높은 SER(49~57%) 확인
PyTorch 모델 체크포인트(.pt)를 ASR 전용 형식(.ckpt)으로 변환하는 스크립트 실행 기록

일본어 ASR 모델 성능 벤치마크 및 문제점 (2023-09-25)
일본어 ASR 모델 평가 및 rt-itn 배포 기록
일본어 STT 모델 배포 준비 및 성능 평가 (Day 838)
2024-07-19 ASR 모델 벤치마크 결과 (Alphanumeric)
일본어 ASR 모델 훈련 성능 저하 관찰 (Day 1571)
RTFx 벤치마크 결과 (2023-10-09)
일본어 음성 인식 모델 테스트 결과 (2024-04-15)
일본어 ASR 파이프라인 설정 및 실험 기록
2025-10-15 업무 및 일본어 ASR 모델 평가
일본어 ASR 모델 성능 검증 및 디버깅 (Day 708)
ASR 성능 벤치마크 및 SER 이슈 분석 (2024-07-18)
ReturnZero Day 1047: 일본어 ASR 모델 검증 및 성능 분석
일본어 ASR 모델 디버깅 및 성능 비교 (Day 704)
mel2vec 영숫자 인식 성능 검증 및 패딩 실험 결과
ReturnZero Day 958: 한자 인식 성능 평가 및 VAD 파라미터 튜닝
ReturnZero Day 837: 일본어 ASR 평가 및 엔진 개발
2025-11-05 업무: 오뚜기 모델 평가 및 L40S Whisper 일본어 성능 검증
MWW 일본어 주소 모델 성능 개선 및 WFS 문제 진단
2024-01-03 할 일: T4 변환 및 성능 평가
ReturnZero Day 832: 일본어 인식 실험 및 Prefix Decoder 평가
일본어 ASR 모델 실험 및 데이터 파이프라인 개선 (Day 811)
VAD 임계값 튜닝 및 성능 평가 (2023-12-07)
주소 인식 모델 성능 검증 및 Triton 배포 전략
ReturnZero Day 860: STT 모델 수정 및 성능 벤치마크
주소 인식 모델 (Address Model) 성능 분석 및 트러블슈팅
ReturnZero Day 903: 모델 최적화 시도 및 성능 벤치마크
일본어 주소 인식 모델 배포 및 MWW STT 성능 검증
전처리 이슈
2025-11-04 업무: L40S Whisper 실시간 성능 검증 및 MWW 모델 훈련
Day 820. 2023-09-28
T4 GPU 환경에서 WFST 모델의 성능 측정 (Day 876)
2024-07-22 업무 및 회고: 일본어 ASR 모델 평가 및 인프라 구축
Pronaia-Engine 코드 폴리싱 및 Triton Mel 성능 검증
Trt) 시도 및 실패 기록
2023-09-07 작업 기록: 일본어 ASR 모델 학습 및 MWW 업무
띄어쓰기 모델 변환 및 성능 테스트
주소 인식 모델 서빙 방식 결정: ONNX Dynamic vs TRT
현대캐피탈 Triton 서버 빌드 및 성능 벤치마크 (Day 1112)
일본어 ASR 모델 (Cutoff) 벤치마킹 및 배포 준비
Qoo10 전사 오류 원인 분석 및 카타카나 모델 벤치마크
Stable Diffusion 모델 체크포인트 링크
Homura-Dan 라이센스 서버 아키텍처 및 RTFx 성능 벤치마크
2024-07-21: ONNX 배포 실패 및 반기 회고
일본어 코드모델 (파나소닉 모델명 인식)
E2E ASR 모델 Triton 서빙 환경 구축 및 테스트 (Day 723)
주소 교정 (Address Correction)
ASR 전사 결과 평가용 프롬프트 영문화 및 간소화
Qoo10 일본어 ASR 파이프라인 및 엔진 성능 테스트 (Day 797)
Day 699: dadumi 배포 및 일본어 ASR 평가
일본어 ASR 모델 학습 및 데이터 전처리 진행 상황 (2024-07-15)
일본어 ASR 실험 및 Utterance Segmenter 개발 현황
STT 성능 벤치마킹 및 특허 기술 아이디어 정리
GEC 모델 ONNX 변환 및 NLP4STT 진행 상황
일본어 음성 인식(ASR) 전사 파이프라인 디버깅 및 경량화 시도
PVI 성능 개선 및 일본어 ASR 모델 이슈 분석
일본어 TTS 기반 학습 및 주소 전사 실험 노트
ASR 방향성 회의 및 3i4k 환경 구축 삽질
PVI 성능 최적화 및 일본어 ASR 모델 개선 현황
일본어 ASR 파이프라인 구축 및 Forced Alignment 문제 해결 시도
ASR 파싱 및 인프라 요구사항 (Day 791)
GPT-SoVITS 감정 표현의 무작위성 및 Gemini 3 평가
일본어 ASR 프로젝트 현황 및 전략 논의 (Day 627)
다듬이 및 일본어 모델 처리 논의 (Day 642)
일본어 ASR 파인튜닝 준비 및 코드 수정
MWW 배포 및 ASR 파이프라인 디버깅 (2024-03-12)
Vito STT 성능 벤치마킹 및 환경 설정 기록 (2024-07-01)
VAD Dynamic Length 및 E2E ASR Config 변경 사항
일본어 Cutoff 모델 배포 준비 및 Partial 응답 속도 검증
2022-06-20 워크샵 및 모델 실험 기록
2025-09-16 일본어 모델 배포 및 설정 작업
음성 언어 식별 모델 평가 및 VAD 개발 계획
데이터 전략 논의 (Day 845)
일본어 STT 모델 벤치마킹 및 인프라 작업 기록 (2025-01-14)
ITN 모델 배포 및 성능 튜닝 (Day 666)
일본어 이름 모델 검증 및 T4 배포 준비
2024-09-19 업무: 일본어 STT 모델 튜닝 및 Prefix Decoder 디버깅
CPU VAD 모델 웜업(Warmup) 및 TensorRT 최적화 실험 결과
일본어 STT 모델 튜닝 및 팀벨 서비스 장애 대응
ASR 성능 데이터
Primary Voice Isolation (PVI) 성능 평가 및 일본어 ASR 개선 계획
Conformer 모델 앙상블 및 BLS 통합 실험 (Day 910)
MWW 일본어 배포 및 가독성 평가 실험 (2024-07-24)
일본어 개발계 배포 준비 및 장애 대응
ReturnZero Day 1765: PVI 및 일본어 ASR 모델 개선 현황
2025-10-13 업무: 일본어 STT 모델 검증 및 제로원 제안서 초안
RTZR 일본어 STT 개발 이력 및 모델 레지스트리 구조
일본어 STT 개발계 배포 및 벤치마크 실행 기록 (Day 872)
VAD 임계값이 이름 학습 모델 성능에 미치는 영향 실험
Day 555: ONNX 모델 배포 및 환경 구성 고민
MWW EKS 배포 장애 및 STT 모델 평가 이슈 (Day 1168)
ReturnZero 분류 모델 성능 보정 실험 (Day 401)
2026-01-14 업무 및 일본어 모델 배포 준비
2024-11-28 업무 및 실험 기록
2025-09-23 업무: 일본어 배포 및 서울소방 로그 분석
2026-05-21 업무: PVI 및 일본어 ASR 모델 개선 현황
PVI 및 일본어 ASR 모델 개선 현황 (2026-05-22)
ReturnZero Day 1061: STT 엔지니어링 및 평가 현황
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-04)
PVI 최적화 및 일본어 ASR 모델 개선 현황 (2026-05-06)
일본어 ASR 얼라인 및 ITN 파이프라인 개발 (Day 635)
2024-11-29 업무 기록: 일본어 모델 개선 및 PII 버그 수정
2026-04-22 업무: PVI, 일본어 ASR 개선 및 Silero VAD 평가
ASR 모델 개선 및 프로젝트 진행 현황 (2026-05-07)
KISA 프로젝트 준비 및 일본어 STT 모델 실험 (Day 1570)
2026-02-02 업무: 일본어 ASR 모델 개선 및 제로원 데이터 처리
PVI 모델 개선 및 일본어 ASR 이슈 분석
PVI 모델 최적화 및 일본어 ASR 개선 현황 (2026-05-27)
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-19)
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-16)
Triton 배포 및 모델 컴파일 파이프라인 정리 (Day 576)
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-13)
2026-01-28 업무: 일본어 ASR 모델 개선 및 데이터셋 구축
TTS 모델 개선 및 제로원 준비
2026-01-29 업무: 일본어 ASR 모델 개선 및 제로원 데이터 이슈
PVI 최적화 및 일본어 ASR 모델 개선 현황 (2026-04-29)
ASR 모델 개선 현황: PVI, 일본어, 화물맨 도메인
ASR 모델 개선 현황: PVI, 일본어, MWW 화물맨
2026-02-03 업무: 일본어 ASR 모델 개선 및 Triton 배포 환경 최적화
Primary Voice Isolation (PVI) 파이프라인 개선 및 일본어 ASR 모델 이슈
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-02-27)
TTS 모델 개선 및 S2 리빌드
화물맨 ASR 도메인 특화 및 일본어 모델 개선 현황
한국어 TTS 정규화 모델 개발 및 일본어 ASR 개선 현황
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-06)
Day 901. 2023-12-18
RTZR 일본어 ASR 개발 이력 및 모델 레지스트리 구조
TTS 모델 개선 및 S2 리빌드 진행
Primary Voice Isolation 및 일본어 ASR 개선 현황 (2026-03-31)
ReturnZero Day 1756: PVI 및 일본어 ASR 개선 이슈
ReturnZero Day 1785: PVI, 일본어 ASR 개선 및 MWW 배포
2026-04-23 업무: PVI 및 일본어 ASR 개선
2026-02-08 업무: 일본어 ASR 모델 개선 및 웰컴 프로젝트 인프라 구축
2026-05-15 업무: PVI, 일본어 ASR, MWW 배포 이슈
2026-01-15 업무 및 일본어 ASR 개선 계획
2026-01-26 업무: 제로원 준비 및 일본어 ASR 개선
Primary Voice Isolation 및 일본어 ASR 개선 과제
TTS 개선 및 S2 리빌드
2026-01-20 업무: 제로원 TTS 데이터 정제 및 일본어 STT 모델 배포 가이드
TTS 개선 및 S2 리빌드
Triton Server 헬름 차트 배포 및 모델 로딩 오류
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
2026-02-26 업무 일지: 일본어 ASR 개선 및 S2 리빌드
일본어 ASR 이슈 및 UBase 타운홀 요약
ReturnZero Day 1794: PVI 및 일본어 ASR 개선 현황
2026-01-27 업무: 제로원 TTS, 일본어 ASR 개선, 두나무 유지보수
ReturnZero Day 1749: PVI 및 일본어 ASR 개선 작업
ReturnZero Day 1736: PVI 및 일본어 ASR 개선 현황
일본어 음성 전사 파이프라인 설계 및 고려사항
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
SIMS 모델 배포 및 게이트웨이 설정 작업
ReturnZero Day 1762: PVI 및 일본어 ASR 개선 현황
ReturnZero Day 1748: PVI 및 일본어 ASR 개선 작업
다국어 RTFx 성능 측정 및 S2 리빌드 현황
2026-01-19 업무: 제로원 TTS 데이터 파이프라인 및 일본어 ASR 모델 개선
2025-01-17 업무: 일본어 STT 벤치마크 및 VAD 튜닝
ReturnZero Day 1625: 웰컴용 Translator 패키징 및 일본어 모델 개선
3i4k 모델 검증 및 VTS 테스트셋 평가 전략
ITN 개발 및 에이전트 아키텍처 논의 (Day 680)
2023-07-27 작업 계획: 일본어 모델 배포 및 Triton 설정
BMT 평가 파이프라인 디버깅 및 데이터 처리 이슈
TMN 음성 인식 오류 분석 및 개선 과제 (2024-04-09)
출장 정리 및 이름 모델 개선 계획 (2023-11-14)
ReturnZero Day 700: 샌박 테스트 결과 및 일본어 STT 프로젝트 현황
Callabo STT 성능 개선 및 일본어 Qoo10 데이터 얼라인 전략
ReturnZero Day 1745: PVI, 일본어 ASR 개선 및 Kubernetes 보안 검토
ReturnZero Day 1743: PVI, 일본어 ASR 개선 및 신한 SDK 빌드
Pronaia Engine Keyword Boosting 모델 전사 테스트 및 배포 준비
Triton Custom Backend 학습 계획 및 모델 웜업 개념 정리
한국어 모델 업데이트 및 ITN 테스트 환경 준비
Day 946: YouTube 데이터 파이프라인 실험 및 Worker 테스트 이슈
일본어 철자전사 Align 및 신한은행 프로젝트 Kickoff
아서의 튜토리얼 - bmt 사용법
2025-10-16 업무: 일본어 STT 실험 및 KISA 프로젝트 준비
2023-03-23 작업 기록: 일본어 ITN 및 Qoo10 ASR 정렬
ITN 모델 최적화 및 데이터 전처리 작업 기록
Project-K 지역락 이슈 및 모델 이미지 재퍼블리시
ReturnZero 일본어 배포 및 문서 수정 (Day 1545)
2026-04-09 업무: PVI, 일본어 ASR 개선 및 TTS 관리 기능 개발
현대캐피탈 Numberplate 모델 장애 진단 및 일본어 T4 모델 준비
Timbel 전사 속도 최적화: VAD Trailing Time 조정
WFST 코드 보완 및 분류 모델 성능 평가 (Day 400)
Istio 네트워크 문제 조사
S2 리빌드 문서화 및 일본어 STT 모델 개선 계획
2026-01-16 업무: 두나무 STT 연동 장애 및 일본어 모델 개선
일본어 NLP 화이트리스트 및 배포 기록
모델 레지스트리 구조화 및 배포 자동화
Primary Voice Isolation(PVI) 및 일본어 ASR 개선 현황
Day 1043: PII Redaction Filter 개발 및 On-Prem 모델 관리
Day 303: 모델 이미지 재배포 및 TTS 연구 시작
ReturnZero Day 1147: AM 모델 학습 API 테스트
2026-01-22 업무 및 모델 개선 이슈
주소 모델 개발 현황
Primary Voice Isolation(PVI) 및 신한은행 다국어 ASR 대응 현황
ReturnZero Day 1058: ASR 파이프라인 진행 상황 및 버그 수정
ReturnZero Day 686: 큐 병목 및 Worker 성능 저하 대응
Day 365: VTS Trial 실험 결과 및 SAC 킥오프
MWW VAD 임계값 수정 및 테스트
음성 데이터 전사 및 변환 작업 현황 (2024-05-22)
BMT 엔진 벤치마크 오류 및 Helm 템플릿 수정
Primary Voice Isolation 평가 및 일본어 ASR 개선, 서비스 채널 용량 산정
ITN 성능 벤치마크 및 토큰화 버그 분석
ReturnZero Day 814: 일본어 모델 학습 속도 문제 및 해결
TTS 모델 개선 및 S2 리빌드
VITO 요약 회의 및 RoBERTa 의도 분석 모델 논의
3i4k 모델 성능 저하 분석 및 Pronaia 클라이언트 개발 현황
유튜브 자막 전사 데이터 손실 및 저장소 오류
Day 875. 2023-11-23
미래에셋 방문 및 일본어 데이터 준비 작업
ReturnZero Day 532: Kiwi 모델 검증 및 일본어 숫자 태깅 규칙 분석
2025-11-07 업무 진행 상황: MWW 모델 평가 및 rtzr-stt 개선
Day 665: ITN 모델 배포 장애 및 환경 정리
2026-01-21 업무: 제로원 TTS 데이터 정제 실패 및 일본어 STT 모델 개선 계획
일본어 STT 이슈
BERT 모델의 ONNX 변환 및 Triton Server 배포 시도 (Day 559)
VTS201020 데이터셋의 압축 포맷 및 배치 크기에 따른 CER 불안정성 분석
일본어 데이터셋 평가 및 온프레미스 환경 설정
Primary Voice Isolation(PVI) 평가 환경 구축 및 신한 SDK 16kHz 대응
ITN 성능 병목 분석 및 일본어 전사 개선 방향
ReturnZero Day 1645: 모델 레지스트리 및 웰컴용 STT 패키징 진행
ReturnZero Day 1643: 모델 레지스트리 구조화 및 전사 장애 분석
ReturnZero Day 858: Confidence Score 적용 및 모델 변경
NLP 모델 오류 패턴 분석 및 개선 방안 (2022-10-28)
Triton Kaldi ASR 클라이언트 메모리 폭주 및 성능 저하 디버깅
Day 847: Triton 테스트 환경 구축 및 특허 전략 논의
2023-08-08 작업 일지: 일본어 학습, MWW 배포, Dadumi
S2 리빌드 문서화 및 다국어 RTFx 측정 환경 구축
2025-10-14 업무: 일본어 STT 튜닝 실험 및 제로원 제안서 초안
ReturnZero Day 482: 비즈니스 통화 스크립트 검토 및 결과 비교 실험
2023-05-12 일본어 모델 학습 및 얼라인, ITN 서비스화 진행 상황
팀벨(Timbel) 평가(Eval) 시스템 디버깅 및 인프라 설정
배포 워크플로우 논의 (Day 859)
TTS 후순위 전환 및 ASR 집중 전략 수립 (2022-05-23)
RTZR-STT 모델 레지스트리 구조화 및 배포 자동화 계획
일본어 가타카나 인식에서 음절 절단 문제 분석
ReturnZero Day 582: 워크플로우 연동 및 Triton 배포 계획
배포 테스트 (2024-09-11)
Triton 서버 구축 및 pysommers 데이터 전처리
일본어 ASR 데이터 전처리 및 Pronaia 메시지 구조 정의
MWW 한국어 SIMS 평가 및 커넥션 릭 재현 테스트
Vocab 실험 및 작업량 분석
Day 897: E2E 테스트, 데이터 증강 및 LM 적용 논의
NLP 문제 정의
Day 323. 2022-05-19
현대캐피탈 고도화: 취약점 패치 및 다중 모델 평가 환경 구축
Day 902: Audio Feature Extraction & Model Check
T4 빌드 및 일본어 NLP 처리 방안
2022-06-10: BMT CER 변동 조사 및 Action Item Detection 서베이
Day 212. 2022-01-28
RTZR 일본어 STT 개발 이력 및 인프라 현황
신한카드 RFI 대응 및 STT 엔진 개발 현황 (Day 1034)
RTBoost Dataset VAD 오류 및 전처리 파이프라인 수정
Triton-Kaldi ASR 성능 벤치마킹 및 메모리 이슈 분석
ITN 수정 및 토크나이징 성능 최적화 고민
프로나이아 모델 배포 및 스마트 어터런스 처리 로직 설계
RL 모델 서빙 고민
Triton-Kaldi ASR 파이프라인 개선 및 스트레스 테스트 계획
일본어 음성 인식 파인튜닝: 문자셋 재정의 및 데이터 혼합 비율 조정
BMT 모델 테스트 및 인프라 설정 (2024-01-05)
2025-06-10 업무 기록: SIMS 빌드 환경, Pacman 모델 평가, 신한카드 컨테이너 오류
Kiwi 모델 빌더 세그먼트 폴트 디버깅 및 ITN 초기 조사
2024-05-17 업무 기록: 키워드 부스트 모델 배포 및 개발 환경 설정
NLP4STT: ITN 평가 메트릭 및 pysommers 의존성 고민
ReturnZero 모델 레지스트리 구조화 및 업무 현황 (Day 1633)
현대캐피탈 차량번호 인식 모델 고도화 및 데이터 필터링
한국어 배포 준비
Day 904: STT 학습 기능 논의 및 배포 준비 (2023-12-21)
일본어 데이터셋 전환 및 Quota 서비스 로직 수정
워커 3단 배포 전략 및 차트 개발 현황
2026-01-23 업무: 제로원 집중 및 일본어 STT 개선
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
일본어 데이터셋 구축 및 전사 파이프라인 디버깅
리팩토링 시도: cdrewrite 및 transducer 기반 태그 삽입 성능 문제
ITN 성능 시험 및 VAD 통합 테스트 진행 (Day 667)
다듬이: 텍스트 처리 파이프라인 성능 최적화 및 병렬화 실험
TTS 기술 이슈 (2026-05-19)
새 일본어 고객 (Day 786)
다듬이 마무리 (Day 702)
Day 610: 태스크 정리 (NLP4STT, 다듬이, 일본어 데이터)
Day 589. 2023-02-09
Pysommers BMT CER 계산 및 화자 구분 세미나 노트
gip-decoder 배포 및 TTS 아키텍처 검토
ReturnZero Day 1622: STT 파이프라인 개선 및 배포 인프라 작업
TMN 회의: 일본어 4자리 숫자 인식 오류 분석
2026-01-30 업무: 일본어 ASR 개선, 제로원 데이터 처리, 두나무 인프라 이슈
프로젝트 Bled 중단 및 SAC 프로젝트 집중
Day 335. 2022-05-31
Day 331. 2022-05-27
Triton 이미지 교체 및 Pronaia Engine 배포 작업
Day 1015: 음성 전처리 교정 및 LLM 임베딩 학습
Pronaia 온프레미스 세미나 준비 및 데이터 파이프라인 문제 해결
압축 이슈 해결
TTS 모델 개선 및 S2 리빌드 진행 상황
RTZR-STT 패키징 자동화 및 모델 레지스트리 설계
MWW 배포 회고 및 테스트 데이터셋 구성 전략
일본어 NLP 파이프라인 및 데이터셋 전처리 작업 기록
fp16 테스트 실패 및 배포 작업 기록
2026-03-09 업무 및 S2 리빌드 현황
일본어 프로젝트 진행 상황
Day 1106. 2024-07-11 업무 요약
Day 1104 (2024-07-09) - ReturnZero Daily Note
ReturnZero 데이터셋 전처리 및 pysommers 파이프라인 디버깅
Day 1055: 전사 품질 필터링 및 Triton E2E 디코딩 오류 분석
2023-01-05 일지: pysommers 배포 문제 해결, NLP4STT 띄어쓰기 모델 최적화 및 사업계획
Recall) 이해 및 HuggingFace Transformers 학습 코드 분석
ReturnZero Day 1644: 모델 레지스트리 구축 및 웰컴용 STT 패키징
Kiwi NLP 모델 빌딩 및 데이터 전처리 작업 기록
ReturnZero STT 솔루션 개발 및 모델 레지스트리 구조화
MWW 한국어 개발계 배포 및 기술적 장애 대응 (2023-11-15)
qoo10 일본어 서버 재가동 및 헬름차트 설정
2022-12-26 회사 근황 및 NLP 기술 검토
Day 491: E2E 음성 인식 서버 배포 장애 및 Kaldi 대체안 검토
Day 490. 2022-11-02
Day 461. 2022-10-04
2026-05-28 업무 및 기술 이슈 요약
2026-05-14 업무 및 기술 이슈 요약
ReturnZero Day 1118: 음성 인식 전사 오류 및 WFST 디코더 호환성 문제
멀티뷰 학습 및 vLLM 서빙 엔진 탐색
한국어 TTS 텍스트 정규화(TN) 경량 모델 개발 진행 상황 (2026-02)
WFST 규칙 최적화 및 성능 평가 (Day 404)
일본어 TMN 회의 및 팀벨 클러스터 작업
Triton 서비스 확장 및 Helm Chart 문제
Torch 의존성 제거 및 Triton 이미지 배포 작업 (Day 658)
Day 61 (2021-08-30) - ReturnZero 일지
Neural-ITN TensorRT 배포 시도 및 한계
Triton Ensemble 구현 및 NLP4STT 띄어쓰기 이슈
STT 관련 고찰
BMT Pronaia VAD 오류 해결 및 seq2seq 학습 기록
삼성 마지막 날: GRPC 서버 개발 및 TTS 요구사항 정의
프로나이아(Pronaia) 전사 요약 기능 개발 및 Kubespray 정리
Day 1022 (2024-04-18) - ReturnZero Daily Note
polyglot-ko 서빙 준비도
Triton Inference Server 성능 저하 및 메모리 누수 원인 분석
현대캐피탈 차량번호 인식 모델 파인튜닝 및 SIMS 일본어 환경 구축
BLS 구현 및 배포 준비 (Day 694)
Day 693. 2023-05-24
다듬이: 일본어 ITN 및 배포 준비
2023-02-24 작업 기록: 일본어 STT 조사 및 통합 ITN 설계
Day 536. 2022-12-18
Day 187. 2022-01-03
Primary Voice Isolation(PVI) 및 신한은행 다국어 STT 대응 현황
S2 리빌드 문서화 및 RTZR STT 솔루션 아키텍처 정리
일본어 데이터 정제 및 전처리 파이프라인 (Day 1562)
Engine 코드 수정 및 검증 (2024-12-27)
STT-LLM-TTS 챗봇 기술 스택 및 설정 초안
Kiwi 형태소 분석기 모델 학습 및 데이터 변환 프로세스
Kiwi 형태소 분석기 모델 학습 및 N-gram 언어모델 이론 정리
SIMS 일본어 설치 및 현대캐피탈 모델 고도화 진행 상황
2024-09-24 업무 진행 사항: 주소 모델 배포 및 시스템 테스트
MWW 한국어 STT 배포 및 SIMS Backend 아키텍처 검토
일본어 Neural ITN 및 4090 환경 빌드 시도
Day 800: 세팅 및 ITN 워커 스펙 변경
Day 8. 2021-07-08
ReturnZero Day 764: 헬름차트 변경 및 배치 처리 아키텍처 논의
Day 657: Vito Worker 배포 및 rt-neural-itn Torch 의존성 제거
2023-03-04 작업 진행 사항 (NLP4STT, 일본어 데이터셋, rt-dadumi)
NeuralITN TRT 변환 성공 및 Triton 포팅 과정
ASR-ITN 파이프라인 최적화 및 재학습 전략 논의
Triton Inference Server 앙상블 배치 처리 검증
NLP4STT 점검: ITN, TER 메트릭 및 테스트셋 구축
2026-03-25 업무 및 기술 이슈 요약
ITN 개선 및 제로원 착수 준비
말 25 마리 중 최속 3 선 찾기 문제 (구글 면접)
TCER) 구현 분석
현대캐피탈 고도화 및 일본어 모델 개발 진행 상황 (Day 1524)
Kaldi ASR 모델 테스트 환경 설정 및 초기 실행 문제
Day 966. 2024-02-22
NLU 기술 동향 및 전시회 메모
Confidence 구현
Day 844. 2023-10-23
오전 업무 스몰토크 (Day 597)
Day 372 (2022-07-07) 작업 기록
ReturnZero Day 359: Python Client 완료 및 3i4k 데이터 FP 검증 시작
Python Client 초기 배포 및 구조 검토 (Day 358)
Day 301. 2022-04-27
일본어 데이터 전사 비교 및 정규화 로직 수정
Day 14. 2021-07-14
dadumi lang 포함
Day 1036: 상태 확인 및 기술적 장애물
2025-08-25 업무: 현대캐피탈 TTS 장애, utterance 암호화, 일본어 모델 디버깅
Day 931. 2024-01-18
PRONAIA BMT 서비스 배포 및 테스트 데이터 준비 현황
통합 ITN 및 S2 Phase 1 진행 상황 (2023-06-05)
CTC Align 실패 현상 및 대안 탐색 (Day 672)
일본어 숫자 및 날짜 처리 로직 개선 (Day 533)
NLP 팀 회의 및 다음 작업 아이템 (2022-05-12)
비즈니스 현황 (2025-10-23)
삼성 SW 검정 프로페셔널 준비 및 재원 형과의 대화
Day 516. 2022-11-28: Kiwi 모델 구축 API 화 및 콜라보 하이라이터 프로토타이핑
현택의 블록체인 기반 데이터 거래 모델 고찰
PRONAIA 엔진 ITN 파이프라인 오류 (FstOpError)
일본어 Pronaia 배포 및 ITN 파이프라인 실험
ITN 배포용 메트릭 설정 및 K8s 테스트베드 구축
일본어 TTS 데이터 전처리 및 학습 구성안
2023-08-22 작업 일지: 일본어 데이터 전처리 및 Pronaia 테스트 환경 구축
Day 588: 띄어쓰기 교정 실험 및 KAIST 채용 심사 기록
SetFit 제로샷 분류 실험 및 ReturnZero 현황 (Day 545)
Day 300: 도커 배포, ivector 디버깅, gRPC 타임아웃 이슈
2026-01-13 업무 및 기술 노트
Pronaia Multilang 배포 디버깅 및 utterance_save 암호화 구현
ReturnZero Day 1489: utterance 암호화 구현 및 Next Model(일본어) 탐색
SIMS 0.4.0 배포 시험 및 설정 검토
MWW EKS 환경 접속 및 배포 준비 (Day 1153)
pysommers 데이터셋 전사 및 파일 매핑 작업 (2024-04-17)
Day 1. 2021-07-01
A-15 조합 5차 총회 주요 안건 및 현황
한중일 한자 발음 매핑 및 데이터베이스 구축 구상
모델 서빙 아키텍처 논의
SIMS 암호화 구현 및 다국어 모델 파이프라인 논의
Day 942: vito-worker 배포 및 STT 파이프라인 설정
Day 937: 다드미 버그 수정, 일본어 데이터 수집, 특허 보완
2023 년 1 월~12 월 업무 회고 및 일본어 ITN 개발 이력
일본어 데이터 전처리 및 정제 규칙 (Day 790)
일본어 관련 의심 단어 목록 및 정제 규칙
일본어 NLP 데이터 정제 및 운영 라이선스 발급
ITN 서비스 배포 및 VAD 통합 구성 검토
Total ensemble model
Day 497. 2022-11-09
Day 428. 2022-09-01
3i4k VTS 데이터 전처리 및 BMT 음성 전사 이슈
2024-12-03 작업 일지: 시스템 튜닝 및 배포
Day 1009: 팀벨 레이턴시 이슈 및 일본어 E2E 세그멘테이션
rt-itn-jp 코드 모델 및 WFST 구현 계획
팀벨 개발 환경 설정 및 SIMS 배포 준비 (Day 959)
일본어 ITN 테스트 및 데이터 문제 확인
Day 727: vitoworker 테스트 복구 및 PoC 준비
Dadumi 배포 및 샌드박스 테스트 진행 상황 (Day 695)
다듬이 (Day 663)
rt-gec 토크나이저 이슈 및 일본어 ITN 학습 데이터 가이드라인
pysommers 개발 진행 상황 및 반성 (2023-01-03)
일본어 ITN 서비스 배포 및 테스트 진행 상황
ReturnZero Day 495: 화자 분리 실패와 룰 기반 FP 감수
ReturnZero Day 1650: 업무 현황 및 제로원 TTS TN 설계 초안
Gemma2 기술 검토
Day 1105. 2024-07-10
기가코리아 개발 회의
음성 분리(Speech Separation) 프로젝트 기술 면접 및 모델 경량화 검토
Triton Server 기반 Kaldi ASR 배포 시도 및 환경 문제
인프라 구축 현황
ReturnZero 프로젝트 관련 기술 링크 모음
Greedy Confidence 및 Entropy 기반 신뢰도 추론 아키텍처
Day 995. 2024-03-22
Pronaia STT 환경 설정 및 특허 미팅 기록 (Day 917)
dadumi한테 어떻게 task를 줄건데
TED 일본어 데이터셋(테스트용)
일본어 qoo10 음성 전사 및 정렬 문제 해결 시도
통합 ITN(다듬이) 아키텍처 및 프로젝트 현황
긴 입력 처리 아키텍처 검토 (Day 586)
업라이즈 AI바우처: 금융 콘텐츠 요약 서비스 및 NLP4STT 기술적 장애물
NLP4STT: Neural ITN Triton화 및 배치 처리
일본어 NLP 파이프라인 디버깅 및 코퍼스 구축
ITN 규칙 대응 및 Kiwi 기반 NLP 파이프라인 개선
맞춤법 검사 자동화 봇 및 데이터 파싱 로직
ReturnZero E2E 파이프라인 실행 순서 및 데이터 구조 분석
Day 448. 2022-09-21
MWW EKS 배포 장애 및 RT-Annotation 문서화 개선
가독성 개선
ReturnZero Day 1062: 워크샵 및 거대모델 대체 전략 논의
최락권 박사님 세미나: 영상 품질 평가(QA) 및 시각 인지 모델
신한카드 K8s 방화벽 설정 및 모델 파이프라인 개선 고민
테스트 진행 상황 (Day 965)
Day 750: Helm Chart, Pronaia Proxy Logic, and Docker Build Tasks
ReturnZero Day 594: 일본어 데이터 파이프라인 및 ITN 아키텍처 검토
Triton Export 및 버전 호환성 문제
Day 369. 2022-07-04
S2 리빌드 및 스택빌더 개발 현황 (2026-02-28)
MWW EKS 인프라 설정 및 API 테스트 기록
Stock Trader 데이터 준비 및 아키텍처 검토
2025-11-03 업무: 두나무 Audit, 오뚜기 모델, 부산소방 연동
Qoo10 데이터 정규화 및 장애 대응 기록
2023-07-31 일일 작업 기록 및 장애 대응
제한 테스트
NLP4STT 프로젝트 마무리 및 팀원 이탈 회고
ITN-JP 숫자 변환 및 테스트셋 구축 (Day 535)
일본어 ITN(숫자 읽기) 디버깅 및 워커 개발
일본어 ITN 포팅 착수 및 띄어쓰기 복원 알고리즘 고민
WFST 어미 인식 개선 및 gop-decoder S3 연동 계획
TTS 연구 파이프라인 정의 및 Project-K 협업 회고
ReturnZero Day 291: gRPC 로직 및 Ali-phone 정렬 디버깅
Day 264. 2022-03-21
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
ReturnZero Day 1651: 업무 현황 및 제로원 TTS TN 정책 정의
현대캐피탈 고도화 이슈 대응 및 utterance_save 암호화 구현
2025-01-06 업무 일지: 일본어 음성 데이터 소스 비교 및 파이프라인 이슈
2024-11-27 작업 기록: 일본어 BMT 실험 및 Pronaia 서버 리팩토링
팀벨 (2024-03-28)
2025-05-21 업무: 두나무 Sentry, SIMS 감사, IBK 배포, 인텔 PoC 결과
03 환경 구축 및 모델 데이터 이전
Kaldi 메모리 오버플로우 및 WER 100% 성능 붕괴 원인 분석
Triton-Kaldi GRPC 통신 분석 및 Sommers 모델 디버깅
다듬이: 음성 텍스트 전처리 로직 개선
2023-07-05 작업 계획 및 MWW 연동 이슈 해결
ITN 논의
일본어 처리 이슈
AWS CLI 환경 설정 및 Triton Server 배포 준비
일본어 데이터 전처리 및 ITN 방침 (Day 623)
rt-dadumi aligner
통합 ITN 인터페이스 통일 및 일본어 프로젝트 일정 조정
ITN 이슈: CTM 정보 복구
맞춤법 데이터 구조 및 토크나이징 전략 논의
Day 285. 2022-04-11

AncomWiki

탐색기

ASR 모델 성능 평가 결과 (2023-10-02)

ASR 모델 성능 평가 결과 (2023-10-02)

Source

Summary

Key Points

그래프 뷰

목차

백링크

AncomWiki

탐색기

ASR 모델 성능 평가 결과 (2023-10-02)

ASR 모델 성능 평가 결과 (2023-10-02)

Source

Summary

Key Points

Related

그래프 뷰

목차

백링크