본 노트는 ‘RAPA’ 정부과제의 사업계획서 작성 현황을 기록한 것으로, AI 기반 음성인식(ASR) 결과의 자동 후보정(Post-correction) 기술 개발을 핵심으로 한다. 기존 ASR이 처리하기 어려운 예능 방송의 구어체(사투리, 유행어, 중첩 발화 등)와 소음 환경에서의 오류를 해결하기 위해, LLM을 활용한 후보정 파이프라인과 전용 하드샘플 데이터셋 구축을 추진 중이다. 주요 수행 내용은 다중 ASR 엔진 결과와 정답 자막의 정밀 정렬을 통한 오류 태깅, 컨텍스트 기반 LLM 파인튜닝, 그리고 Triton/vLLM 기반의 추론 시스템 아키텍처 설계이다. 최종 목표는 CER(문자 오류율) 감소 및 구두점/개체명 인식 정확도 향상을 통해 방송사 편집 워크플로우에 적용 가능한 실증 모델을 개발하는 것이다.
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
RAPA 과제: 음성인식 오류교정 데이터셋 및 사업계획서
-
RAPA 방송영상 AI 학습용 데이터 구축 과제 킥오프 및 Pacman Stack Builder 현황
-
일본어 ASR 파인튜닝 준비 및 코드 수정
-
ASR-ITN 파이프라인 최적화 및 재학습 전략 논의
-
일본어 ASR 프로젝트 현황 및 전략 논의 (Day 627)
-
Pacman 스택 빌더 구조화 및 RAPA 과제 서베이
-
Jetson Nano 클러스터 기반 TensorTrade 병렬 학습 환경 구축
-
일본어 데이터셋 구축 및 전사 파이프라인 디버깅
-
2025-06-30 업무 진행 사항: RAPA 과제 리뷰 준비 및 현대캐피탈 SIMS 고도화
-
농협카드 Docker 전환 검토 및 현대캐피탈 음성인식 고도화
-
업라이즈 AI바우처: 금융 콘텐츠 요약 서비스 및 NLP4STT 기술적 장애물
-
ASR 방향성 회의 및 3i4k 환경 구축 삽질
-
2026-01-28 업무: 일본어 ASR 모델 개선 및 데이터셋 구축
-
MWW SIMS 개발 현황
-
가위바위보 기반 AI 소개팅 게임 앱
-
음성 분리(Speech Separation) 프로젝트 기술 면접 및 모델 경량화 검토
-
2025-07-09 업무: RAPA 발표자료 및 프로젝트 수정
-
GPU 오퍼레이터 설치 및 Air-gapped 환경 구축 준비
-
CentOS 7 기반 NVIDIA GPU 환경 구축 및 모델 배포 준비
-
NLP4STT 점검: ITN, TER 메트릭 및 테스트셋 구축
-
Day 847: Triton 테스트 환경 구축 및 특허 전략 논의
-
ReturnZero 데이터셋 전처리 및 pysommers 파이프라인 디버깅
-
한중일 한자 발음 매핑 및 데이터베이스 구축 구상
-
ITN 배포용 메트릭 설정 및 K8s 테스트베드 구축
-
Raspberry Pi 3 기반 k3s 및 스토리지 서비스 구축 계획
-
ReturnZero Day 1644: 모델 레지스트리 구축 및 웰컴용 STT 패키징
-
Day 1042 작업 기록: 데이터셋, MWW 버그, 인프라
-
WSL 환경 구축 및 AI 개발 스택 설정
-
CD 파이프라인 구축 계획
-
팀벨(Timbel) 개발 환경 구축 및 라이선스 발급 기록
-
현대캐피탈 차량번호 인식 모델 파인튜닝 및 SIMS 일본어 환경 구축
-
Raspberry Pi 클러스터 구축 및 스토리지 고민
-
개인 위키 시스템 구축 요구사항 및 기술 스택 고려사항
-
Raspberry Pi 3 기반 IP 카메라 스트리밍 및 AI 추론 아키텍처
-
인프라 구축 현황
-
모델 서빙 아키텍처 논의
-
MWW PoC 환경 구축 및 일본 PoC 진행 현황
-
일본어 ASR 파이프라인 구축 및 Forced Alignment 문제 해결 시도
-
일본어 NLP 파이프라인 및 데이터셋 전처리 작업 기록
-
Whisper 차트 개선 및 배포 자동화
-
ReturnZero Day 1134: 에어갭 환경 구축 및 MWW 오류 대응
-
2024-05-17 일기: Llama 3 양자화 가이드 및 일본어 데이터셋 수집
-
일본어 음성 인식(ASR) 전사 파이프라인 디버깅 및 경량화 시도
-
TTS 인프라 개선 및 웰컴저축은행 프로젝트 킥오프
-
Translator 차트 개선
-
E2E ASR 모델 Triton 서빙 환경 구축 및 테스트 (Day 723)
-
RTZR-STT 모델 레지스트리 구조화 및 배포 자동화 계획
-
RTZR-STT 패키징 자동화 및 모델 레지스트리 설계
-
모델 레지스트리 구조화 및 배포 자동화
-
2025-08-20 업무: 현대캐피탈 고도화, 암호화 구현, Next Model 환경 구축
-
Pronaia-engine 법무 검토 요청 및 Pacman 오픈소스 정리
-
STT-LLM-TTS 챗봇 기술 스택 및 설정 초안
-
2024-07-22 업무 및 회고: 일본어 ASR 모델 평가 및 인프라 구축
-
NLP4STT: ITN 및 띄어쓰기 후처리 개선
-
rtzr-stt Pacman 개선 및 VAD 필터 기술 검토
-
ReturnZero Day 1622: STT 파이프라인 개선 및 배포 인프라 작업
-
MWW 한국어 SIMS 및 팀벨 인프라 구축 현황
-
일본어 데이터셋 평가 및 온프레미스 환경 설정
-
일본어 NLP 파이프라인 디버깅 및 코퍼스 구축
-
ITN 규칙 대응 및 Kiwi 기반 NLP 파이프라인 개선
-
ITN-JP 숫자 변환 및 테스트셋 구축 (Day 535)
-
2025-12-10 업무: STT 패키징, VAD 필터링, 및 인프라 개편
-
2023-03-04 작업 진행 사항 (NLP4STT, 일본어 데이터셋, rt-dadumi)
-
통합 ITN 및 S2 Phase 1 진행 상황 (2023-06-05)
-
2025-11-18 업무: Pacman 개선, MWW 점검, AI Agent 방향성 고민
-
03 환경 구축 및 모델 데이터 이전
-
현대캐피탈 고도화: 취약점 패치 및 다중 모델 평가 환경 구축
-
Primary Voice Isolation 및 일본어 ASR 개선 과제
-
pysommers 개발 진행 상황 및 반성 (2023-01-03)
-
AICT 문장 띄어쓰기 벤치마크 및 워커 컨테이너 테스트
-
과제
-
폐쇄망(Air-gapped) Kubernetes 환경 구축 및 도구 평가
-
일본어 TTS 기반 학습 및 주소 전사 실험 노트
-
차트 개편
-
rtzr-stt 파이프라인 개선 및 STT 인식 오류 분석 (2025-11-12)
-
MWW 사업 리뷰 및 오뚜기 음성 인식 이슈 대응
-
LLM 엔지니어링 및 한국어 모델 학습 환경 구축 참고 자료
-
2025-07-08 업무 진행 상황 (RAPA, SIMS, 현대캐피탈)
-
제로원 프로젝트 진행 상황 및 기술적 이슈 (2026-01-12)
-
2025-11-07 업무 진행 상황: MWW 모델 평가 및 rtzr-stt 개선
-
제한 테스트
-
2025-09-03 업무: SIMS 일본어화 및 현대캐피탈 고도화 진행 상황
-
RAPA 정부과제 발표자료 작성 및 업무 진행 상황 (2025-07-10)
-
S2 리빌드 문서화 및 다국어 RTFx 측정 환경 구축
-
2025-07-11 업무 진행 상황 (RAPA, 현대캐피탈, Pronaia)
-
Primary Voice Isolation(PVI) 평가 환경 구축 및 신한 SDK 16kHz 대응
-
TMN 음성 인식 오류 분석 및 개선 과제 (2024-04-09)
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
2025-04-17 업무 진행 상황 및 과제 논의
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
통합 ITN(다듬이) 아키텍처 및 프로젝트 현황
-
rtzr-stt Pacman 개선 및 부산소방 이슈 대응 (2025-11-10)
-
TED 일본어 데이터셋(테스트용)
-
2025-07-02 업무 진행 상황 (RAPA, 현대캐피탈, 두나무, 신협, 삼성전자)
-
MWW 배포 회고 및 테스트 데이터셋 구성 전략
-
로컬 AI 환경 구축과 그 의미에 대한 성찰
-
Raspberry Pi 4 클러스터 (K3s) 구축 및 운영 기록
-
Pacman 차트 개편 및 현대캐피탈 VAD 이슈 대응
-
2025-02-06 업무 및 기술 검토 (팩맨, 두나무, MWW)
-
ReturnZero Day 1139: 개발 환경 구축 및 시스템 장애 대응
-
Triton 서버 구축 및 pysommers 데이터 전처리
-
2023 년 1 월~12 월 업무 회고 및 일본어 ITN 개발 이력
-
다듬이 (2023-07-06)
-
금융상품 데이터 레거시 문제 및 ChatGPT 온프레미스 도입 필요성
-
일본어 ITN 서비스 배포 및 테스트 진행 상황
-
차트 개선 및 두나무 EKS 접속 이슈
-
Whisper 인프라 개선, 브라우저 DNN 탐색
-
차트 개선
-
현대캐피탈 차량번호 인식 모델 고도화 및 데이터 필터링
-
TMN 회의: 일본어 4자리 숫자 인식 오류 분석
-
2023-08-22 작업 일지: 일본어 데이터 전처리 및 Pronaia 테스트 환경 구축
-
2023-09-07 작업 기록: 일본어 ASR 모델 학습 및 MWW 업무
-
2026-02-08 업무: 일본어 ASR 모델 개선 및 웰컴 프로젝트 인프라 구축
-
ReturnZero Day 1756: PVI 및 일본어 ASR 개선 이슈
-
Storage 문제 및 운영 환경 구축
-
Day 1132: Airgap 환경 구축 및 GPU Operator 배포 시도
-
SIMS 고도화 및 K8s 환경 구축 작업 기록 (Day 1492)
-
pysommers 데이터셋 전사 및 파일 매핑 작업 (2024-04-17)
-
MWW 한국어 SIMS 평가 및 커넥션 릭 재현 테스트
-
Envoy 로드밸런싱 문제 해결
-
Day 950: PTQ 세미나 및 작업 진행 상황
-
ITN 서비스 배포 및 VAD 통합 구성 검토
-
Primary Voice Isolation 및 일본어 ASR 개선 현황 (2026-03-31)
-
NLP4STT: Neural ITN Triton화 및 배치 처리
-
2023-01-05 일지: pysommers 배포 문제 해결, NLP4STT 띄어쓰기 모델 최적화 및 사업계획
-
RL 모델 서빙 고민
-
Kiwi 형태소 분석기 학습 데이터 확보 및 일본어 ITN 개발 현황
-
ReturnZero Day 1749: PVI 및 일본어 ASR 개선 작업
-
ReturnZero Day 1743: PVI, 일본어 ASR 개선 및 신한 SDK 빌드
-
ITN 개선 및 제로원 착수 준비
-
S2 리빌드 및 스택빌더 문서화 진행 상황
-
S2 리빌드 및 스택빌더 개발 현황 (2026-02-28)
-
ASR 모델 개선 및 프로젝트 진행 현황 (2026-05-07)
-
ReturnZero 모델 레지스트리 구조화 및 업무 현황 (Day 1633)
-
한국어 TTS 텍스트 정규화(TN) 경량 모델 개발 진행 상황 (2026-02)
-
2026-01-19 업무: 제로원 TTS 데이터 파이프라인 및 일본어 ASR 모델 개선
-
ReturnZero Day 1650: 업무 현황 및 제로원 TTS TN 설계 초안
-
2026-03-25 업무 및 기술 이슈 요약
-
출장 정리 및 이름 모델 개선 계획 (2023-11-14)
-
2026-04-23 업무: PVI 및 일본어 ASR 개선
-
2025-08-25 업무: 현대캐피탈 TTS 장애, utterance 암호화, 일본어 모델 디버깅
-
2025-08-22 업무: 현대캐피탈 고도화, 암호화 구현, Next Model 디버깅
-
일본어 ASR 모델 학습 및 데이터 전처리 진행 상황 (2024-07-15)
-
두나무 프로젝트 EKS 환경 구축 및 패킹 스크립트 점검
-
신한카드 프로젝트: GPU 모니터링 및 화자분리 파이프라인 구축 검토
-
일본어 데이터셋 전환 및 Quota 서비스 로직 수정
-
신한은행 다국어 음성인식 벤치마킹 및 IT 인프라 이슈
-
두나무 인프라 구축 및 환경 설정 작업 (Day 1329)
-
PVC 구성 전략 (ReturnZero)
-
팀벨 프로젝트: 개인정보 필터링 및 서버 구축 작업
-
Stable Diffusion 파인튜닝 및 LLM 환경 구축 기록
-
NLU 기술 동향 및 전시회 메모
-
2026-05-21 업무: PVI 및 일본어 ASR 모델 개선 현황
-
주소 교정 (Address Correction)
-
ITN 모델 최적화 및 데이터 전처리 작업 기록
-
2023-02-24 작업 기록: 일본어 STT 조사 및 통합 ITN 설계
-
통합 ITN 인터페이스 통일 및 일본어 프로젝트 일정 조정
-
ITN 파이프라인 통합 및 일본어 정규화 작업 현황 (Day 602)
-
NLP4STT: ITN 평가 메트릭 및 pysommers 의존성 고민
-
2026-05-14 업무 및 기술 이슈 요약
-
S2 리빌드 문서화 및 RTZR STT 솔루션 아키텍처 정리
-
2025-09-11 업무 진행 상황: 일본어 TMN, dadumi, 현대캐피탈
-
2024-09-30 업무 일지: 신한카드 및 서울소방재난본부 프로젝트 진행 상황
-
stamcord 아키텍처 개선 및 하드웨어 프로젝트 메모
-
ReturnZero Day 495: 화자 분리 실패와 룰 기반 FP 감수
-
STT 실시간 엔진 배포 가이드 및 데이터셋 전처리 현황
-
주소 인식 모델 서빙 방식 결정: ONNX Dynamic vs TRT
-
일본어 Neural ITN 및 4090 환경 빌드 시도
-
Qoo10 일본어 ASR 파이프라인 및 엔진 성능 테스트 (Day 797)
-
2023-05-12 일본어 모델 학습 및 얼라인, ITN 서비스화 진행 상황
-
ITN 개발 및 에이전트 아키텍처 논의 (Day 680)
-
Total ensemble model
-
2022-12-13 작업 기록: NLP 파이프라인 디버깅 및 일본어 ITN 통합
-
ReturnZero Day 1765: PVI 및 일본어 ASR 모델 개선 현황
-
Primary Voice Isolation(PVI) 및 일본어 ASR 개선 현황
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-16)
-
2026-02-26 업무 일지: 일본어 ASR 개선 및 S2 리빌드
-
2026-01-22 업무 및 모델 개선 이슈
-
ReturnZero STT 솔루션 개발 및 모델 레지스트리 구조화
-
인텔 프로젝트 현황
-
2025-11-11 업무 및 기술 노트
-
2025-09-25 업무 및 Docker Hub 장애 대응
-
어제를 사는 힘 (2025-11-18)
-
2025-09-12 업무 우선순위: 일본어 배치 및 GPT 작업
-
2025-08-27 업무 우선순위 및 기술 이슈
-
2025-08-11 업무: 현대캐피탈 고도화, utterance_save 암호화, Next Model, 신한카드
-
SIMS 암호화 구현 및 다국어 모델 파이프라인 논의
-
현대캐피탈 고도화: SIMS 설치 및 인프라 구성 이슈
-
일본어 코드모델 (파나소닉 모델명 인식)
-
일본어 음성 인식 모델 테스트 결과 (2024-04-15)
-
2017-06-26 일지: 이더리움 손절 및 distributed-workerpool 개발
-
Stable Diffusion 모델 체크포인트 링크
-
리팩토링 시도: cdrewrite 및 transducer 기반 태그 삽입 성능 문제
-
KOF99 네스츠 데이터 기반 AI 학습 아이디어
-
신한카드 개발 환경 구축 및 문제점 (Day 1198)
-
Z-Image 기술 동향 및 AI 도구 메모
-
한국어 모델 업데이트 및 ITN 테스트 환경 준비
-
일본어 Pronaia 배포 및 ITN 파이프라인 실험
-
ReturnZero Day 837: 일본어 ASR 평가 및 엔진 개발
-
일본어 ITN 테스트 및 데이터 문제 확인
-
Day 800: 세팅 및 ITN 워커 스펙 변경
-
대방 방문 작업 목록 및 기술적 이슈 (2023-08-16)
-
다듬이 마무리 (Day 702)
-
Dadumi 배포 및 샌드박스 테스트 진행 상황 (Day 695)
-
ITN Triton 통합 배포 및 스레드 풀 문제
-
ITN 성능 벤치마크 및 토큰화 버그 분석
-
일본어 ASR 얼라인 및 ITN 파이프라인 개발 (Day 635)
-
2023-03-23 작업 기록: 일본어 ITN 및 Qoo10 ASR 정렬
-
rt-gec 토크나이저 이슈 및 일본어 ITN 학습 데이터 가이드라인
-
GEC 모델 ONNX 변환 및 NLP4STT 진행 상황
-
일본어 ITN(숫자 읽기) 디버깅 및 워커 개발
-
rt-highlighter 배포 및 프로젝트 진행 상황 (Day 502)
-
TTS 후순위 전환 및 ASR 집중 전략 수립 (2022-05-23)
-
2026-05-28 업무 및 기술 이슈 요약
-
PVI 성능 최적화 및 일본어 ASR 모델 개선 현황
-
ReturnZero Day 1736: PVI 및 일본어 ASR 개선 현황
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-19)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-13)
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
2026-01-23 업무: 제로원 집중 및 일본어 STT 개선
-
2026-01-20 업무: 제로원 TTS 데이터 정제 및 일본어 STT 모델 배포 가이드
-
ReturnZero Day 1645: 모델 레지스트리 및 웰컴용 STT 패키징 진행
-
2025-09-26 현대캐피탈 현장 방문 및 STT 서비스 상태 확인
-
SIMS 이슈 발생
-
현대캐피탈 고도화 및 일본어 모델 개발 진행 상황 (Day 1524)
-
2025-08-28 업무 우선순위 및 기술 이슈
-
2025-08-21 업무: 현대캐피탈 고도화, utterance 암호화, Next Model 배포
-
2025-06-09 업무 진행 사항 (SIMS, Stack-Builder, 현대캐피탈)
-
2025-06-05 업무: SIMS 로깅, dadumi 에러 분석, 현대캐피탈 현행화 준비
-
2024-07-21: ONNX 배포 실패 및 반기 회고
-
전처리 이슈
-
편의점 강도 대비 자동 조준 CCTV 구상
-
다듬이: Turn 기반 처리 파이프라인 재설계 및 Pandas 인덱스 문제
-
두나무 Sentry 온프레미스 구축 및 SIMS 감사로그 구현 계획
-
MWW 스크럼: AWS 인스턴스 시뮬레이션 환경 구축
-
한국어 배포 준비
-
MWW 한국어 개발계 배포 및 기술적 장애 대응 (2023-11-15)
-
Whisper Dadumi 대응 및 언어 정보 처리
-
dadumi-whisper 파이프라인 개선 및 현대캐피탈 업무
-
일본어 ASR 모델 성능 벤치마크 및 문제점 (2023-09-25)
-
일본어 ASR 모델 평가 및 rt-itn 배포 기록
-
2023-08-28 일일 작업 기록: 일본어 데이터 분석, 현대캐피탈 장애 대응, GPU Operator 설치
-
2023-08-08 작업 일지: 일본어 학습, MWW 배포, Dadumi
-
다듬이: 일본어 ITN 및 배포 준비
-
ITN 성능 병목 분석 및 일본어 전사 개선 방향
-
일본어 ITN 포팅 착수 및 띄어쓰기 복원 알고리즘 고민
-
Day 323. 2022-05-19
-
ReturnZero Day 1794: PVI 및 일본어 ASR 개선 현황
-
PVI 모델 최적화 및 일본어 ASR 개선 현황 (2026-05-27)
-
화물맨 ASR 도메인 특화 및 일본어 모델 개선 현황
-
ReturnZero Day 1762: PVI 및 일본어 ASR 개선 현황
-
ReturnZero Day 1748: PVI 및 일본어 ASR 개선 작업
-
2026-04-09 업무: PVI, 일본어 ASR 개선 및 TTS 관리 기능 개발
-
Primary Voice Isolation(PVI) 및 신한은행 다국어 STT 대응 현황
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
2026-01-15 업무 및 일본어 ASR 개선 계획
-
ReturnZero Day 1625: 웰컴용 Translator 패키징 및 일본어 모델 개선
-
2025-11-21 업무: 두나무 인프라 장애, Pacman 차트 개선, MWW 대응
-
SIMS 모델 배포 및 게이트웨이 설정 작업
-
일본어 ASR 모델 (Cutoff) 벤치마킹 및 배포 준비
-
SIMS 일본어 설치 및 현대캐피탈 모델 고도화 진행 상황
-
2025-06-10 업무 기록: SIMS 빌드 환경, Pacman 모델 평가, 신한카드 컨테이너 오류
-
두나무 업무 및 차트 리팩토링 계획 (Day 1338)
-
VITO 요약 회의 및 RoBERTa 의도 분석 모델 논의
-
Day 1104 (2024-07-09) - ReturnZero Daily Note
-
ASR 전사 결과 평가용 프롬프트 영문화 및 간소화
-
ReturnZero Day 1061: STT 엔지니어링 및 평가 현황
-
신한카드 RFI 대응 및 STT 엔진 개발 현황 (Day 1034)
-
기가코리아 개발 회의
-
Szurubooru 배포 및 설정 메모
-
GPT-SoVITS 감정 표현의 무작위성 및 Gemini 3 평가
-
2018-05-08 ETRI 재섭 발표
-
ChatGPT-4o, 음성인식 및 관련 기술 탐색
-
Stable Diffusion WebUI Docker 환경 구축 및 에러 해결 기록
-
Greedy Confidence 및 Entropy 기반 신뢰도 추론 아키텍처
-
이슈 대응 (2025-04-01)
-
RLHF(인간 피드백 기반 강화학습) 개요
-
일본어 음성 전사 파이프라인 설계 및 고려사항
-
주소 인식 모델 (Address Model) 성능 분석 및 트러블슈팅
-
mww 운영계 배포 아키텍처 및 구성 요소
-
2024-01-03 할 일: T4 변환 및 성능 평가
-
mel2vec 영숫자 인식 성능 검증 및 패딩 실험 결과
-
ReturnZero Day 903: 모델 최적화 시도 및 성능 벤치마크
-
Day 8. 2021-07-08
-
ASR 파싱 및 인프라 요구사항 (Day 791)
-
일본어 ASR 모델 디버깅 및 성능 비교 (Day 704)
-
일본어 처리 이슈
-
일어 음성 처리 파이프라인 디버깅 및 ITN 수정
-
Day 665: ITN 모델 배포 장애 및 환경 정리
-
ReturnZero Day 594: 일본어 데이터 파이프라인 및 ITN 아키텍처 검토
-
띄어쓰기 모델 변환 및 성능 테스트
-
Triton Ensemble 구현 및 NLP4STT 띄어쓰기 이슈
-
일본어 ITN (Inverse Text Normalization) 처리 규칙 및 문제점
-
2022-11-21 작업 기록: 한글 교정 로직 수정 및 Highlighter PoC 환경 설정
-
NLP4STT: 교정 전후 문자열 매핑 및 띄어쓰기 복원 알고리즘
-
ITN 이슈: CTM 정보 복구
-
신한은행 인프라 연동 및 라벨링 파이프라인 논의
-
3i4k 모델 검증 및 VTS 테스트셋 평가 전략
-
일본어 ASR 이슈 및 UBase 타운홀 요약
-
ASR 모델 개선 현황: PVI, 일본어, MWW 화물맨
-
PVI 최적화 및 일본어 ASR 모델 개선 현황 (2026-05-06)
-
PVI 성능 개선 및 일본어 ASR 모델 이슈 분석
-
Primary Voice Isolation (PVI) 성능 평가 및 일본어 ASR 개선 계획
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 계획
-
TTS 개선 및 S2 리빌드
-
TTS 모델 개선 및 S2 리빌드
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
일본어 주소 인식 시스템 개선 및 파인튜닝 전략
-
2026-01-13 업무 및 기술 노트
-
2026-01-02 업무 및 제로원 TTS TN 프로젝트 킥오프
-
RTZR 일본어 ASR 개발 이력 및 모델 레지스트리 구조
-
일본어 음성 인식 파인튜닝: 문자셋 재정의 및 데이터 혼합 비율 조정
-
2025-09-10 업무 우선순위 및 이슈 (일본어 배포, dadumi, 현대캐피탈)
-
2025-09-08 업무: 일본어 SIMS 배포 및 현대캐피탈 고도화 준비
-
2025-09-02 업무: 일본어 T4, 현대캐피탈 고도화, utterance 암호화
-
2025-08-29 업무: 현대캐피탈 고도화 및 일본어 SIMS 배포 준비
-
2025-08-26 업무 진행 사항: sommers ja 테스트, 현대캐피탈 고도화, utterance_save 암호화
-
2025-08-13 업무 진행 상황: 현대캐피탈, utterance 암호화, Next Model 디버깅
-
현대캐피탈 고도화 운영 준비 및 SIMS 암호화 구현 현황
-
현대캐피탈 고도화 프로젝트: MWW 회의 및 인프라 설치 계획
-
2025-06-04 업무 진행 상황: 두나무, SIMS, zLogger, 현대캐피탈 및 영업 현황
-
Day 1426. 2025-05-26 - 업무
-
2025-03-10 업무 진행 사항 (팩맨, 두나무)
-
두나무)
-
Kubespray 오프라인 환경 설정 및 NFS 프로비저너 배포 작업
-
SIMS 0.4.0 배포 시험 및 설정 검토
-
2024-12-12 업무 및 신한카드 아이쏠라 배치 준비
-
2024-09-24 업무 진행 사항: 주소 모델 배포 및 시스템 테스트
-
일본어 주소 인식 모델 배포 및 MWW STT 성능 검증
-
스케줄링 이슈
-
2024-05-29 업무 및 기술 작업 기록
-
멀티뷰 학습 및 vLLM 서빙 엔진 탐색
-
Timbel 전사 속도 최적화: VAD Trailing Time 조정
-
Illustrious XL 및 일관성 있는 캐릭터 생성 워크플로우
-
두나무 EKS 인프라 구축 및 팩맨 스크립터 개선
-
ReturnZero 프로젝트 관련 기술 링크 모음
-
ReturnZero 리서치 프로젝트 현황 (2022-01)
-
MWW 배포 및 ASR 파이프라인 디버깅 (2024-03-12)
-
MWW VAD 임계값 수정 및 테스트
-
PRONAIA 엔진 ITN 파이프라인 오류 (FstOpError)
-
2024 Q1 OKR 초안: 신한은행 이관 및 포스코 데이터 테스트
-
주소 인식 모델 성능 검증 및 Triton 배포 전략
-
T4 GPU 환경에서 WFST 모델의 성능 측정 (Day 876)
-
Day 851: 팀벨 미팅 및 현대캐피탈 운영 이슈
-
일본어 STT 모델 배포 준비 및 성능 평가 (Day 838)
-
ASR 모델 성능 평가 결과 (2023-10-02)
-
미래에셋 방문 및 일본어 데이터 준비 작업
-
워커 3단 배포 전략 및 차트 개발 현황
-
일본어 ASR 모델 성능 검증 및 디버깅 (Day 708)
-
AWS CLI 환경 설정 및 Triton Server 배포 준비
-
NLP4STT 프로젝트 마무리 및 팀원 이탈 회고
-
일본어 데이터 전처리 및 ITN 방침 (Day 623)
-
일본어 STT 이슈
-
2022-12-26 회사 근황 및 NLP 기술 검토
-
CD 및 Transcriber 최적화 진행 상황
-
Kiwi 모델 빌더 세그먼트 폴트 디버깅 및 ITN 초기 조사
-
맞춤법 검사 자동화 봇 및 데이터 파싱 로직
-
PVI 및 일본어 ASR 모델 개선 현황 (2026-05-22)
-
TTS 기술 이슈 (2026-05-19)
-
2026-04-22 업무: PVI, 일본어 ASR 개선 및 Silero VAD 평가
-
ReturnZero Day 1745: PVI, 일본어 ASR 개선 및 Kubernetes 보안 검토
-
다국어 RTFx 성능 측정 및 S2 리빌드 현황
-
S2 리빌드 및 다국어 RTFx 측정 (2026-03-11)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-06)
-
S2 리빌드 및 스택빌더(S2 Rebuild & StackBuilder) 개발 현황
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-02-27)
-
TTS 모델 개선 및 S2 리빌드
-
TTS 모델 개선 및 S2 리빌드 진행 상황
-
TTS 모델 개선 및 제로원 준비
-
2026-01-27 업무: 제로원 TTS, 일본어 ASR 개선, 두나무 유지보수
-
2026-01-21 업무: 제로원 TTS 데이터 정제 실패 및 일본어 STT 모델 개선 계획
-
Day 1590. 2025-11-06 - 업무 진행 상황
-
2025-10-15 업무 및 일본어 ASR 모델 평가
-
2025-09-19 업무: 송세화 면접 준비 및 Dadumi Aligner 디버깅
-
현대캐피탈 배포 및 제로원 프로젝트 킥오프
-
ReturnZero Day 1500: 현대캐피탈 고도화 및 utterance_save 암호화 구현
-
현대캐피탈 고도화 및 utterance_save 암호화 구현 현황 (2025-08-04)
-
Day 1380. 2025-04-10 - 업무
-
2024-11-29 업무 기록: 일본어 모델 개선 및 PII 버그 수정
-
일본어 프로젝트 진행 상황
-
Istio 네트워크 문제 조사
-
2024-09-25 업무 및 기술 이슈 요약
-
VAD Dynamic Length 및 E2E ASR Config 변경 사항
-
2024-08-14 업무 및 프로젝트 진행 상황
-
Day 1105. 2024-07-10
-
Day 1043: PII Redaction Filter 개발 및 On-Prem 모델 관리
-
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
-
Day 1009: 팀벨 레이턴시 이슈 및 일본어 E2E 세그멘테이션
-
보고서 수정 및 재구성 작업 목록
-
20250502 ARP 테이블 스냅샷
-
발표 스킬 및 연구 이슈 정리 (2019.12.17)
-
화행 분석을 위한 한국어 형태소 분석기 평가 및 규칙 기반 접근의 한계
-
Day 516. 2022-11-28: Kiwi 모델 구축 API 화 및 콜라보 하이라이터 프로토타이핑
-
현택의 블록체인 기반 데이터 거래 모델 고찰
-
테스트 진행 상황 (Day 965)
-
Day 957: 주소모델 실험 및 Kubernetes GPU 환경 설정
-
MWW 한국어 STT 배포 및 SIMS Backend 아키텍처 검토
-
PRONAIA BMT 서비스 배포 및 테스트 데이터 준비 현황
-
STT 성능 벤치마킹 및 특허 기술 아이디어 정리
-
Pronaia STT 환경 설정 및 특허 미팅 기록 (Day 917)
-
Day 904: STT 학습 기능 논의 및 배포 준비 (2023-12-21)
-
Day 901. 2023-12-18
-
일본어 이름 모델 검증 및 T4 배포 준비
-
Day 820. 2023-09-28
-
일본어 ASR 모델 실험 및 데이터 파이프라인 개선 (Day 811)
-
일본어 철자전사 Align 및 신한은행 프로젝트 Kickoff
-
일본어 데이터 전처리 및 정제 규칙 (Day 790)
-
일본어 ASR 데이터 전처리 및 Pronaia 메시지 구조 정의
-
MWW K8s Batch Cronjob 해제 및 현대캐피탈 방문 준비
-
Qoo10 데이터 정규화 및 장애 대응 기록
-
dadumi
-
2023-07-05 작업 계획 및 MWW 연동 이슈 해결
-
일본어 ASR 실험 및 Utterance Segmenter 개발 현황
-
BLS 구현 및 배포 준비 (Day 694)
-
ITN 수정 및 토크나이징 성능 최적화 고민
-
ITN 논의
-
Callabo STT 성능 개선 및 일본어 Qoo10 데이터 얼라인 전략
-
CTC Align 실패 현상 및 대안 탐색 (Day 672)
-
일본어 ASR 파이프라인 설정 및 실험 기록
-
TCER) 구현 분석
-
Kiwi 형태소 분석기 모델 학습 및 데이터 변환 프로세스
-
ReturnZero Day 482: 비즈니스 통화 스크립트 검토 및 결과 비교 실험
-
2022-07-11 일일 작업 기록: Pynini 트랜스듀서 디버깅 및 MariaDB 환경 설정
-
Pysommers BMT CER 계산 및 화자 구분 세미나 노트
-
Day 212. 2022-01-28
-
ReturnZero Day 1785: PVI, 일본어 ASR 개선 및 MWW 배포
-
PVI 모델 개선 및 일본어 ASR 이슈 분석
-
2026-05-15 업무: PVI, 일본어 ASR, MWW 배포 이슈
-
Primary Voice Isolation(PVI) 및 신한은행 다국어 ASR 대응 현황
-
Primary Voice Isolation (PVI) 연구 계획서
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-04)
-
한국어 TTS 정규화 모델 개발 및 일본어 ASR 개선 현황
-
TTS 개선 및 S2 리빌드
-
2026-01-30 업무: 일본어 ASR 개선, 제로원 데이터 처리, 두나무 인프라 이슈
-
2026-01-26 업무: 제로원 준비 및 일본어 ASR 개선
-
ReturnZero Day 1623: STT 파이프라인 개선 및 인프라 자동화
-
2025-11-03 업무: 두나무 Audit, 오뚜기 모델, 부산소방 연동
-
AB 사업 리뷰 및 KISA 클러스터 IP 이전
-
MWW-TMN 배포 및 인프라 문제 해결 (2025-10-21)
-
2025-10-14 업무: 일본어 STT 튜닝 실험 및 제로원 제안서 초안
-
일본어 데이터 정제 및 전처리 파이프라인 (Day 1562)
-
ReturnZero 일본어 배포 및 문서 수정 (Day 1545)
-
2025-09-16 일본어 모델 배포 및 설정 작업
-
현대캐피탈 고도화 이슈 대응 및 utterance_save 암호화 구현
-
현대캐피탈 고도화 및 utterance_save 암호화 구현 현황 (2025-08-05)
-
현대캐피탈 고도화 및 utterance 암호화 구현 진행 상황
-
현대캐피탈 고도화: utterance_save 암호화 구현 진행 상황
-
2025-05-29 업무 및 타운홀 기록
-
2025-05-27 업무 진행 사항 (두나무, 신한카드, 팩맨 빌더)
-
2025-01-16 업무 및 프로젝트 현황
-
프로나이아(Pronaia) 전사 요약 기능 개발 및 Kubespray 정리
-
MWW EKS 환경 접속 및 배포 준비 (Day 1153)
-
2024-07-19 ASR 모델 벤치마크 결과 (Alphanumeric)
-
PII 영향 분석)
-
홈서버 인프라 현황 및 개선 계획
-
RLLib 얼라인: 학습 코드 검토 및 Google Trends 데이터 검증
-
SUJ-298 메일 발송 인프라 구축 및 도메인 설정 문제
-
RBAC 설정 작업 기록
-
2024-09-26: AI 연구 전략, Llama 3.2 및 로컬 LLM 도구
-
강화학습 기반 암호화폐 자동매매 프로젝트 제안
-
SIMS 개발계 배포 및 Envoy gRPC 로드밸런싱 설정
-
SIMS 헬름 구성 및 파이프라인 자동화 고민
-
Day 875. 2023-11-23
-
배포 워크플로우 논의 (Day 859)
-
2023-07-27 작업 계획: 일본어 모델 배포 및 Triton 설정
-
현대 캐피탈 프로젝트 마무리 및 대용량 파일 처리
-
VITOSpeech Engine 동시접속 제한 및 현대캐피탈 PoC 준비
-
NLP 문제 정의
-
Day 699: dadumi 배포 및 일본어 ASR 평가
-
ITN: 텍스트 토크나이징 및 인퍼런스 파이프라인 개선
-
fp16 테스트 실패 및 배포 작업 기록
-
ITN 성능 시험 및 VAD 통합 테스트 진행 (Day 667)
-
Alignment 설명
-
ReturnZero Day 582: 워크플로우 연동 및 Triton 배포 계획
-
Day 555: ONNX 모델 배포 및 환경 구성 고민
-
Day 536. 2022-12-18
-
Day 490. 2022-11-02
-
Day 425: 환경 설정 문제 및 하이라이터 프로젝트 방향성
-
Day 372 (2022-07-07) 작업 기록
-
3i4k 데이터셋을 활용한 화행분류 Feasibility 검토
-
Triton Custom Backend 학습 계획 및 모델 웜업 개념 정리
-
Day 187. 2022-01-03
-
2026-03-09 업무 및 S2 리빌드 현황
-
S2 리빌드 및 스택빌더 이슈 해결
-
TTS 모델 개선 및 S2 리빌드 진행
-
RTZR 일본어 STT 개발 이력 및 모델 레지스트리 구조
-
2025-11-05 업무: 오뚜기 모델 평가 및 L40S Whisper 일본어 성능 검증
-
OpenSearch
-
2025-09-23 업무: 일본어 배포 및 서울소방 로그 분석
-
현대캐피탈 Numberplate 모델 장애 진단 및 일본어 T4 모델 준비
-
2025-08-12 업무 진행 상황: 현대캐피탈, utterance 암호화, Next Model, 신한카드, 쿠팡 PoC
-
현대캐피탈 고도화 및 utterance 암호화 구현 현황
-
현대캐피탈 고도화: SIMS 배포 및 환경 설정 (Day 1465)
-
2025-06-17 업무 진행 사항 (Pacman, 두나무, SIMS)
-
2025-06-02 업무 진행 사항 (두나무, SIMS, zLogger, Stack-Builder)
-
2025-01-22 업무 진행 사항: 팩맨 저장소 변경, 워커 테스트셋 구조 개선, 코드 리뷰
-
Triton 이미지 교체 및 Pronaia Engine 배포 작업