본 노트는 ‘RAPA’ 정부과제의 사업계획서 작성 현황을 기록한 것으로, AI 기반 음성인식(ASR) 결과의 자동 후보정(Post-correction) 기술 개발을 핵심으로 한다. 기존 ASR 기술이 예능 방송의 구어체, 소음, 다중 화자 환경에서 한계를 보이는 점을 문제의식으로 삼고, 이를 해결하기 위해 LLM 기반 후보정 파이프라인과 특화 데이터셋을 구축한다. 주요 수행 내용은 하드샘플(Hard Sample) 기반의 오류 유형 분류, 컨텍스트 기반 LLM 파인튜닝, 그리고 Triton/vLLM 기반의 추론 시스템 아키텍처 설계이다. 궁극적인 목표는 CER(문자 오류율) 감소 및 구두점/개체명 정확도 향상을 통해 방송사 편집 워크플로우의 효율성을 높이고, 한국어 LLM 생태계의 데이터 병목 현상을 해소하는 것이다.
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
RAPA 과제: 음성인식 오류교정 데이터셋 및 사업계획서
-
RAPA 방송영상 AI 학습용 데이터 구축 과제 킥오프 및 Pacman Stack Builder 현황
-
GoP 발음 평가 및 NLP 과제 방향성 재정의
-
2024-11-28 업무 및 실험 기록
-
일본어 ASR 프로젝트 현황 및 전략 논의 (Day 627)
-
Pacman 스택 빌더 구조화 및 RAPA 과제 서베이
-
업라이즈 AI바우처: 금융 콘텐츠 요약 서비스 및 NLP4STT 기술적 장애물
-
ASR 전사 결과 평가용 프롬프트 영문화 및 간소화
-
일본어 데이터셋 구축 및 전사 파이프라인 디버깅
-
ASR 방향성 회의 및 3i4k 환경 구축 삽질
-
가위바위보 기반 AI 소개팅 게임 앱
-
WSL 환경 구축 및 AI 개발 스택 설정
-
KOF99 네스츠 데이터 기반 AI 학습 아이디어
-
TMN 음성 인식 오류 분석 및 개선 과제 (2024-04-09)
-
2026-01-28 업무: 일본어 ASR 모델 개선 및 데이터셋 구축
-
Jetson Nano 클러스터 기반 TensorTrade 병렬 학습 환경 구축
-
인프라 구축 현황
-
NLP4STT 점검: ITN, TER 메트릭 및 테스트셋 구축
-
농협카드 Docker 전환 검토 및 현대캐피탈 음성인식 고도화
-
Day 847: Triton 테스트 환경 구축 및 특허 전략 논의
-
TED 일본어 데이터셋(테스트용)
-
음성 분리(Speech Separation) 프로젝트 기술 면접 및 모델 경량화 검토
-
pysommers 데이터셋 전사 및 파일 매핑 작업 (2024-04-17)
-
ChatGPT-4o, 음성인식 및 관련 기술 탐색
-
2025-11-18 업무: Pacman 개선, MWW 점검, AI Agent 방향성 고민
-
2024-09-26: AI 연구 전략, Llama 3.2 및 로컬 LLM 도구
-
ITN-JP 숫자 변환 및 테스트셋 구축 (Day 535)
-
Raspberry Pi 3 기반 IP 카메라 스트리밍 및 AI 추론 아키텍처
-
2025-06-30 업무 진행 사항: RAPA 과제 리뷰 준비 및 현대캐피탈 SIMS 고도화
-
일본어 ASR 파이프라인 구축 및 Forced Alignment 문제 해결 시도
-
ReturnZero Day 1644: 모델 레지스트리 구축 및 웰컴용 STT 패키징
-
2023-03-04 작업 진행 사항 (NLP4STT, 일본어 데이터셋, rt-dadumi)
-
한중일 한자 발음 매핑 및 데이터베이스 구축 구상
-
RLHF(인간 피드백 기반 강화학습) 개요
-
ReturnZero Day 495: 화자 분리 실패와 룰 기반 FP 감수
-
Z-Image 기술 동향 및 AI 도구 메모
-
ITN 배포용 메트릭 설정 및 K8s 테스트베드 구축
-
Day 1042 작업 기록: 데이터셋, MWW 버그, 인프라
-
강화학습 기반 암호화폐 자동매매 프로젝트 제안
-
일본어 NLP 파이프라인 및 데이터셋 전처리 작업 기록
-
MWW PoC 환경 구축 및 일본 PoC 진행 현황
-
Whisper 차트 개선 및 배포 자동화
-
일본어 음성 인식(ASR) 전사 파이프라인 디버깅 및 경량화 시도
-
Qoo10 일본어 ASR 파이프라인 및 엔진 성능 테스트 (Day 797)
-
일본어 ASR 실험 및 Utterance Segmenter 개발 현황
-
RTZR-STT 모델 레지스트리 구조화 및 배포 자동화 계획
-
일본어 TTS 기반 학습 및 주소 전사 실험 노트
-
AICT 문장 띄어쓰기 벤치마크 및 워커 컨테이너 테스트
-
Raspberry Pi 3 기반 k3s 및 스토리지 서비스 구축 계획
-
Primary Voice Isolation 및 일본어 ASR 개선 과제
-
ReturnZero 데이터셋 전처리 및 pysommers 파이프라인 디버깅
-
팀벨(Timbel) 개발 환경 구축 및 라이선스 발급 기록
-
일본어 NLP 파이프라인 디버깅 및 코퍼스 구축
-
일본어 ASR 모델 학습 및 데이터 전처리 진행 상황 (2024-07-15)
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
빅데이터의 적용 분야 및 모델링 통찰
-
의료 데이터셋 연구 메모
-
STT-LLM-TTS 챗봇 기술 스택 및 설정 초안
-
Callabo STT 성능 개선 및 일본어 Qoo10 데이터 얼라인 전략
-
ITN 규칙 대응 및 Kiwi 기반 NLP 파이프라인 개선
-
신한카드 프로젝트: GPU 모니터링 및 화자분리 파이프라인 구축 검토
-
ReturnZero Day 1134: 에어갭 환경 구축 및 MWW 오류 대응
-
2024-07-22 업무 및 회고: 일본어 ASR 모델 평가 및 인프라 구축
-
통합 ITN 및 S2 Phase 1 진행 상황 (2023-06-05)
-
개인 위키 시스템 구축 요구사항 및 기술 스택 고려사항
-
AI 채팅 및 음성 도구 목록
-
MWW 한국어 SIMS 및 팀벨 인프라 구축 현황
-
일본어 데이터셋 전환 및 Quota 서비스 로직 수정
-
GPU 오퍼레이터 설치 및 Air-gapped 환경 구축 준비
-
리팩토링 시도: cdrewrite 및 transducer 기반 태그 삽입 성능 문제
-
주소 인식 모델 서빙 방식 결정: ONNX Dynamic vs TRT
-
AI 프리랜서 관련 참고 링크
-
Kiwi 형태소 분석기 학습 데이터 확보 및 일본어 ITN 개발 현황
-
Recall) 이해 및 HuggingFace Transformers 학습 코드 분석
-
MWW 사업 리뷰 및 오뚜기 음성 인식 이슈 대응
-
RL 기반 주식 트레이딩 봇 설계: 에피소드 길이 및 데이터 고려사항
-
CentOS 7 기반 NVIDIA GPU 환경 구축 및 모델 배포 준비
-
일본어 코드모델 (파나소닉 모델명 인식)
-
과제
-
Day 516. 2022-11-28: Kiwi 모델 구축 API 화 및 콜라보 하이라이터 프로토타이핑
-
주소 인식 모델 (Address Model) 성능 분석 및 트러블슈팅
-
주소 교정 (Address Correction)
-
2024-05-17 일기: Llama 3 양자화 가이드 및 일본어 데이터셋 수집
-
TD3 기반 주식 트레이딩 알고리즘 설계
-
Primary Voice Isolation(PVI) 평가 환경 구축 및 신한 SDK 16kHz 대응
-
스크립트 기반 자동 타이핑 기계 아이디어
-
차트 개편
-
현대캐피탈 차량번호 인식 모델 파인튜닝 및 SIMS 일본어 환경 구축
-
VITO 요약 회의 및 RoBERTa 의도 분석 모델 논의
-
일본어 음성 인식 모델 테스트 결과 (2024-04-15)
-
화행 분석을 위한 한국어 형태소 분석기 평가 및 규칙 기반 접근의 한계
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
2025-07-09 업무: RAPA 발표자료 및 프로젝트 수정
-
STT 실시간 엔진 배포 가이드 및 데이터셋 전처리 현황
-
폐쇄망(Air-gapped) Kubernetes 환경 구축 및 도구 평가
-
일본어 데이터셋 평가 및 온프레미스 환경 설정
-
mel2vec 영숫자 인식 성능 검증 및 패딩 실험 결과
-
전처리 이슈
-
2025-07-08 업무 진행 상황 (RAPA, SIMS, 현대캐피탈)
-
2026-01-23 업무: 제로원 집중 및 일본어 STT 개선
-
NLP4STT: ITN 및 띄어쓰기 후처리 개선
-
NLP4STT: ITN 평가 메트릭 및 pysommers 의존성 고민
-
2026-04-23 업무: PVI 및 일본어 ASR 개선
-
RL 모델 서빙 고민
-
TCER) 구현 분석
-
ReturnZero Day 482: 비즈니스 통화 스크립트 검토 및 결과 비교 실험
-
모델 서빙 아키텍처 논의
-
ReturnZero Day 1756: PVI 및 일본어 ASR 개선 이슈
-
Day 461. 2022-10-04
-
2026-02-08 업무: 일본어 ASR 모델 개선 및 웰컴 프로젝트 인프라 구축
-
S2 리빌드 문서화 및 다국어 RTFx 측정 환경 구축
-
다듬이 마무리 (Day 702)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-13)
-
rtzr-stt 파이프라인 개선 및 STT 인식 오류 분석 (2025-11-12)
-
2026-05-14 업무 및 기술 이슈 요약
-
신뢰통신 과제 워크샵(4차) 핵심 요약
-
Day 8. 2021-07-08
-
Day 875. 2023-11-23
-
Primary Voice Isolation(PVI) 및 일본어 ASR 개선 현황
-
제한 테스트
-
S2 리빌드 및 스택빌더 개발 현황 (2026-02-28)
-
RTZR-STT 패키징 자동화 및 모델 레지스트리 설계
-
Day 1106. 2024-07-11 업무 요약
-
ReturnZero Day 1743: PVI, 일본어 ASR 개선 및 신한 SDK 빌드
-
2025-04-17 업무 진행 상황 및 과제 논의
-
신한은행 다국어 음성인식 벤치마킹 및 IT 인프라 이슈
-
현택의 블록체인 기반 데이터 거래 모델 고찰
-
ReturnZero Day 1749: PVI 및 일본어 ASR 개선 작업
-
로컬 AI 환경 구축과 그 의미에 대한 성찰
-
2025-07-11 업무 진행 상황 (RAPA, 현대캐피탈, Pronaia)
-
ASR 파싱 및 인프라 요구사항 (Day 791)
-
일본어 ASR 데이터 전처리 및 Pronaia 메시지 구조 정의
-
금융상품 데이터 레거시 문제 및 ChatGPT 온프레미스 도입 필요성
-
일본어 STT 이슈
-
Day 588: 띄어쓰기 교정 실험 및 KAIST 채용 심사 기록
-
띄어쓰기 모델 변환 및 성능 테스트
-
맞춤법 검사 자동화 봇 및 데이터 파싱 로직
-
ITN 개선 및 제로원 착수 준비
-
한국어 TTS 텍스트 정규화(TN) 경량 모델 개발 진행 상황 (2026-02)
-
일본어 ASR 모델 훈련 성능 저하 관찰 (Day 1571)
-
일본어 ASR 모델 (Cutoff) 벤치마킹 및 배포 준비
-
ReturnZero STT 서비스 운영 및 신한은행 다국어 프로젝트 준비
-
출장 정리 및 이름 모델 개선 계획 (2023-11-14)
-
TMN 회의: 일본어 4자리 숫자 인식 오류 분석
-
ReturnZero Day 1061: STT 엔지니어링 및 평가 현황
-
편의점 강도 대비 자동 조준 CCTV 구상
-
2023-08-22 작업 일지: 일본어 데이터 전처리 및 Pronaia 테스트 환경 구축
-
ASR 모델 개선 및 프로젝트 진행 현황 (2026-05-07)
-
다듬이: Turn 기반 처리 파이프라인 재설계 및 Pandas 인덱스 문제
-
CD 파이프라인 구축 계획
-
대화 발화 병합 및 규칙 기반 분류 파이프라인 설계
-
Storage 문제 및 운영 환경 구축
-
2026-01-22 업무 및 모델 개선 이슈
-
MWW 배포 회고 및 테스트 데이터셋 구성 전략
-
FST 기반 분류기 구조 및 코드 리팩토링 (Day 435)
-
두나무 EKS 인프라 구축 및 팩맨 스크립터 개선
-
팀벨 프로젝트: 개인정보 필터링 및 서버 구축 작업
-
Day 901. 2023-12-18
-
T4 GPU 환경에서 WFST 모델의 성능 측정 (Day 876)
-
데이터 전략 논의 (Day 845)
-
ReturnZero Day 837: 일본어 ASR 평가 및 엔진 개발
-
일본어 ASR 모델 성능 벤치마크 및 문제점 (2023-09-25)
-
일본어 ASR 파인튜닝 준비 및 코드 수정
-
일본어 ASR 모델 성능 검증 및 디버깅 (Day 708)
-
ITN 서비스 배포 및 VAD 통합 구성 검토
-
다듬이 및 일본어 모델 처리 논의 (Day 642)
-
오전 업무 스몰토크 (Day 597)
-
2023-01-05 일지: pysommers 배포 문제 해결, NLP4STT 띄어쓰기 모델 최적화 및 사업계획
-
Kiwi 형태소 분석기 모델 학습 및 데이터 변환 프로세스
-
ReturnZero Day 488: 팀 기조 변경 및 NLP 전략 재정의
-
STT 관련 고찰
-
3i4k 데이터셋을 활용한 화행분류 Feasibility 검토
-
Triton-Kaldi ASR 파이프라인 개선 및 스트레스 테스트 계획
-
Day 187. 2022-01-03
-
ASR 모델 개선 현황: PVI, 일본어, MWW 화물맨
-
ReturnZero Day 1762: PVI 및 일본어 ASR 개선 현황
-
Primary Voice Isolation (PVI) 연구 계획서
-
2026-03-25 업무 및 기술 이슈 요약
-
TTS 개선 및 S2 리빌드
-
제로원 프로젝트 진행 상황 및 기술적 이슈 (2026-01-12)
-
ReturnZero Day 1643: 모델 레지스트리 구조화 및 전사 장애 분석
-
모델 레지스트리 구조화 및 배포 자동화
-
ReturnZero Day 1622: STT 파이프라인 개선 및 배포 인프라 작업
-
rtzr-stt Pacman 개선 및 VAD 필터 기술 검토
-
TTS 인프라 개선 및 웰컴저축은행 프로젝트 킥오프
-
일본어 음성 인식 파인튜닝: 문자셋 재정의 및 데이터 혼합 비율 조정
-
ReturnZero 일본어 배포 및 문서 수정 (Day 1545)
-
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
-
멀티뷰 학습 및 vLLM 서빙 엔진 탐색
-
Day 1022 (2024-04-18) - ReturnZero Daily Note
-
Timbel 전사 속도 최적화: VAD Trailing Time 조정
-
2025-08-20 업무: 현대캐피탈 고도화, 암호화 구현, Next Model 환경 구축
-
2025-07-02 업무 진행 상황 (RAPA, 현대캐피탈, 두나무, 신협, 삼성전자)
-
두나무 Sentry 온프레미스 구축 및 SIMS 감사로그 구현 계획
-
ReturnZero Day 1139: 개발 환경 구축 및 시스템 장애 대응
-
청자 기술 학습
-
Greedy Confidence 및 Entropy 기반 신뢰도 추론 아키텍처
-
PVC 구성 전략 (ReturnZero)
-
Stable Diffusion 파인튜닝 및 LLM 환경 구축 기록
-
일본어 음성 전사 파이프라인 설계 및 고려사항
-
Day 931. 2024-01-18
-
2024-01-03 할 일: T4 변환 및 성능 평가
-
Day 902: Audio Feature Extraction & Model Check
-
Day 820. 2023-09-28
-
일본어 ASR 모델 평가 및 rt-itn 배포 기록
-
ReturnZero Day 764: 헬름차트 변경 및 배치 처리 아키텍처 논의
-
일본어 qoo10 음성 전사 및 정렬 문제 해결 시도
-
다듬이 (Day 663)
-
ReturnZero Day 640: 텍스트 처리 파이프라인 리팩토링 및 세그멘테이션 이슈
-
ITN 모델 최적화 및 데이터 전처리 작업 기록
-
NLP4STT: Neural ITN Triton화 및 배치 처리
-
pysommers 개발 진행 상황 및 반성 (2023-01-03)
-
SetFit 제로샷 분류 실험 및 ReturnZero 현황 (Day 545)
-
CD 및 Transcriber 최적화 진행 상황
-
ReturnZero Day 532: Kiwi 모델 검증 및 일본어 숫자 태깅 규칙 분석
-
2022-12-13 작업 기록: NLP 파이프라인 디버깅 및 일본어 ITN 통합
-
Day 527. 2022-12-09
-
NLP4STT: 교정 전후 문자열 매핑 및 띄어쓰기 복원 알고리즘
-
Day 497. 2022-11-09
-
NLP 모델 오류 패턴 분석 및 개선 방안 (2022-10-28)
-
ReturnZero: WFSTClassifier 리팩토링 및 명명 규칙 정리
-
Day 428. 2022-09-01
-
Day 390: 핵심성분 분석 및 WFST 테스트 진행
-
Day 212. 2022-01-28
-
ReturnZero Day 1794: PVI 및 일본어 ASR 개선 현황
-
PVI 모델 최적화 및 일본어 ASR 개선 현황 (2026-05-27)
-
2026-05-21 업무: PVI 및 일본어 ASR 모델 개선 현황
-
화물맨 ASR 도메인 특화 및 일본어 모델 개선 현황
-
PVI 성능 개선 및 일본어 ASR 모델 이슈 분석
-
2026-04-09 업무: PVI, 일본어 ASR 개선 및 TTS 관리 기능 개발
-
Primary Voice Isolation(PVI) 및 신한은행 다국어 STT 대응 현황
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 계획
-
ReturnZero 모델 레지스트리 구조화 및 업무 현황 (Day 1633)
-
ReturnZero STT 솔루션 개발 및 모델 레지스트리 구조화
-
2025-12-10 업무: STT 패키징, VAD 필터링, 및 인프라 개편
-
차트 개선 및 두나무 EKS 접속 이슈
-
Translator 차트 개선
-
MWW-TMN 배포 및 인프라 문제 해결 (2025-10-21)
-
2025-10-14 업무: 일본어 STT 튜닝 실험 및 제로원 제안서 초안
-
Day 14. 2021-07-14
-
일본어 STT 모델 벤치마킹 및 인프라 작업 기록 (2025-01-14)
-
ReturnZero Day 1147: AM 모델 학습 API 테스트
-
2024-07-21: ONNX 배포 실패 및 반기 회고
-
Day 1104 (2024-07-09) - ReturnZero Daily Note
-
ReturnZero Day 1062: 워크샵 및 거대모델 대체 전략 논의
-
Stable Diffusion 모델 체크포인트 링크
-
LLM 엔지니어링 및 한국어 모델 학습 환경 구축 참고 자료
-
E2E ASR 모델 Triton 서빙 환경 구축 및 테스트 (Day 723)
-
03 환경 구축 및 모델 데이터 이전