본 노트는 ‘RAPA’ 정부과제 수행을 위한 안상홍 팀장의 업무 기록이다. 주요 내용은 트위그팜 측에 발송한 이메일 초안과 사업계획서 작성 개요로 구성된다. 이메일에서는 LLM 기반 음성인식 오류 교정용 데이터셋의 메타데이터 구조(YAML 스펙) 검토와 사업계획서 템플릿 요청을 담고 있다. 사업계획서 초안 부분에서는 ASR 기술 동향, 한국어 방송 데이터의 특수성(구어체, 소음 등)으로 인한 데이터 병목 문제, 그리고 LLM 기반 후보정의 필요성을 기술 배경으로 서술하고 있다. 다만, 세부 수행 내용과 알고리즘 부분은 ‘땡땡’이라는 플레이스홀더로 채워져 있어 미완성 상태이며, 일부 섹션은 드라마 요약 AI 모델 개발 내용으로 혼재되어 있어 정제도가 낮다.
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
RAPA 방송영상 AI 학습용 데이터 구축 과제 킥오프 및 Pacman Stack Builder 현황
-
Pacman 스택 빌더 구조화 및 RAPA 과제 서베이
-
STT 관련 고찰
-
맞춤법 검사 자동화 봇 및 데이터 파싱 로직
-
2025-06-30 업무 진행 사항: RAPA 과제 리뷰 준비 및 현대캐피탈 SIMS 고도화
-
TED 일본어 데이터셋(테스트용)
-
2023-03-04 작업 진행 사항 (NLP4STT, 일본어 데이터셋, rt-dadumi)
-
2025-07-09 업무: RAPA 발표자료 및 프로젝트 수정
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
농협카드 Docker 전환 검토 및 현대캐피탈 음성인식 고도화
-
과제
-
MWW SIMS 개발 현황
-
ReturnZero 데이터셋 전처리 및 pysommers 파이프라인 디버깅
-
현대캐피탈 고도화: SIMS 설치 및 인프라 구성 이슈
-
2026-01-28 업무: 일본어 ASR 모델 개선 및 데이터셋 구축
-
금융상품 데이터 레거시 문제 및 ChatGPT 온프레미스 도입 필요성
-
pysommers 데이터셋 전사 및 파일 매핑 작업 (2024-04-17)
-
Day 1042 작업 기록: 데이터셋, MWW 버그, 인프라
-
일본어 데이터셋 전환 및 Quota 서비스 로직 수정
-
일본어 데이터셋 구축 및 전사 파이프라인 디버깅
-
신한은행 다국어 음성인식 벤치마킹 및 IT 인프라 이슈
-
일본어 NLP 파이프라인 및 데이터셋 전처리 작업 기록
-
Pronaia-engine 법무 검토 요청 및 Pacman 오픈소스 정리
-
통합 ITN 및 S2 Phase 1 진행 상황 (2023-06-05)
-
음성 분리(Speech Separation) 프로젝트 기술 면접 및 모델 경량화 검토
-
T4 빌드 및 일본어 NLP 처리 방안
-
rtzr-stt Pacman 개선 및 VAD 필터 기술 검토
-
Pacman 차트 개편 및 현대캐피탈 VAD 이슈 대응
-
ReturnZero Day 1645: 모델 레지스트리 및 웰컴용 STT 패키징 진행
-
모델 서빙 아키텍처 논의
-
ReturnZero Day 1644: 모델 레지스트리 구축 및 웰컴용 STT 패키징
-
rtzr-stt 파이프라인 개선 및 STT 인식 오류 분석 (2025-11-12)
-
MWW 배포 회고 및 테스트 데이터셋 구성 전략
-
일본어 철자전사 Align 및 신한은행 프로젝트 Kickoff
-
S2 리빌드 및 스택빌더 개발 현황 (2026-02-28)
-
2024 Q1 OKR 초안: 신한은행 이관 및 포스코 데이터 테스트
-
TTS 인프라 개선 및 웰컴저축은행 프로젝트 킥오프
-
Whisper 차트 개선 및 배포 자동화
-
일본어 STT 이슈
-
일본어 ITN 서비스 배포 및 테스트 진행 상황
-
RTZR-STT 패키징 자동화 및 모델 레지스트리 설계
-
모델 레지스트리 구조화 및 배포 자동화
-
RTZR-STT 모델 레지스트리 구조화 및 배포 자동화 계획
-
제로원 프로젝트 진행 상황 및 기술적 이슈 (2026-01-12)
-
2025-12-10 업무: STT 패키징, VAD 필터링, 및 인프라 개편
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
STT-LLM-TTS 챗봇 기술 스택 및 설정 초안
-
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
-
2025-04-17 업무 진행 상황 및 과제 논의
-
S2 리빌드 문서화 및 RTZR STT 솔루션 아키텍처 정리
-
인텔 프로젝트 현황
-
Primary Voice Isolation 및 일본어 ASR 개선 과제
-
MWW 사업 리뷰 및 오뚜기 음성 인식 이슈 대응
-
ITN 개선 및 제로원 착수 준비
-
일본어 프로젝트 진행 상황
-
일본어 데이터셋 평가 및 온프레미스 환경 설정
-
2025-07-11 업무 진행 상황 (RAPA, 현대캐피탈, Pronaia)
-
RLLib 얼라인: 학습 코드 검토 및 Google Trends 데이터 검증
-
2025-07-02 업무 진행 상황 (RAPA, 현대캐피탈, 두나무, 신협, 삼성전자)
-
일본어 데이터 정제 및 전처리 파이프라인 (Day 1562)
-
일본어 STT 모델 벤치마킹 및 인프라 작업 기록 (2025-01-14)
-
2025-07-08 업무 진행 상황 (RAPA, SIMS, 현대캐피탈)
-
S2 리빌드 및 스택빌더 문서화 진행 상황
-
Dadumi 배포 및 샌드박스 테스트 진행 상황 (Day 695)
-
NLP 문제 정의
-
차트 개선 및 두나무 EKS 접속 이슈
-
pysommers 개발 진행 상황 및 반성 (2023-01-03)
-
2024-05-17 일기: Llama 3 양자화 가이드 및 일본어 데이터셋 수집
-
STT 실시간 엔진 배포 가이드 및 데이터셋 전처리 현황
-
NLU 기술 동향 및 전시회 메모
-
미래에셋 방문 및 일본어 데이터 준비 작업
-
Day 950: PTQ 세미나 및 작업 진행 상황
-
Translator 차트 개선
-
현대캐피탈 차량번호 인식 모델 고도화 및 데이터 필터링
-
2025-09-03 업무: SIMS 일본어화 및 현대캐피탈 고도화 진행 상황
-
2026-01-20 업무: 제로원 TTS 데이터 정제 및 일본어 STT 모델 배포 가이드
-
다듬이 (2023-07-06)
-
가독성 개선
-
프로젝트 Bled 중단 및 SAC 프로젝트 집중
-
S2 리빌드 문서화 및 다국어 RTFx 측정 환경 구축
-
2025-11-07 업무 진행 상황: MWW 모델 평가 및 rtzr-stt 개선
-
RAPA 정부과제 발표자료 작성 및 업무 진행 상황 (2025-07-10)
-
2018-05-08 ETRI 재섭 발표
-
현대캐피탈 Numberplate 모델 장애 진단 및 일본어 T4 모델 준비
-
rt-highlighter 배포 및 프로젝트 진행 상황 (Day 502)
-
S2 리빌드 및 다국어 RTFx 측정 (2026-03-11)
-
현대캐피탈 차량번호 인식 모델 파인튜닝 및 SIMS 일본어 환경 구축
-
2026-01-23 업무: 제로원 집중 및 일본어 STT 개선
-
ReturnZero 모델 레지스트리 구조화 및 업무 현황 (Day 1633)
-
2025-09-11 업무 진행 상황: 일본어 TMN, dadumi, 현대캐피탈
-
업라이즈 AI바우처: 금융 콘텐츠 요약 서비스 및 NLP4STT 기술적 장애물
-
2025-06-09 업무 진행 사항 (SIMS, Stack-Builder, 현대캐피탈)
-
삼성 마지막 날: GRPC 서버 개발 및 TTS 요구사항 정의
-
ReturnZero Day 1622: STT 파이프라인 개선 및 배포 인프라 작업
-
차트 개편
-
Whisper 인프라 개선, 브라우저 DNN 탐색
-
차트 개선
-
dadumi lang 포함
-
2024-09-19 업무: 일본어 STT 모델 튜닝 및 Prefix Decoder 디버깅
-
20250502 ARP 테이블 스냅샷
-
ReturnZero Day 1625: 웰컴용 Translator 패키징 및 일본어 모델 개선
-
2025-09-25 업무 및 Docker Hub 장애 대응
-
SIMS 이슈 발생
-
2024-09-24 업무 진행 사항: 주소 모델 배포 및 시스템 테스트
-
S2 리빌드 및 스택빌더 이슈 해결
-
화물맨 ASR 도메인 특화 및 일본어 모델 개선 현황
-
2025-08-27 업무 우선순위 및 기술 이슈
-
ASR 모델 개선 현황: PVI, 일본어, MWW 화물맨
-
2025-08-13 업무 진행 상황: 현대캐피탈, utterance 암호화, Next Model 디버깅
-
2025-09-12 업무 우선순위: 일본어 배치 및 GPT 작업
-
2024-09-25 업무 및 기술 이슈 요약
-
2024-05-29 업무 및 기술 작업 기록
-
ReturnZero Day 1745: PVI, 일본어 ASR 개선 및 Kubernetes 보안 검토
-
2026-05-14 업무 및 기술 이슈 요약
-
2026-02-26 업무 일지: 일본어 ASR 개선 및 S2 리빌드
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-04)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-16)
-
ReturnZero Day 1650: 업무 현황 및 제로원 TTS TN 설계 초안
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-13)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-19)
-
2026-04-23 업무: PVI 및 일본어 ASR 개선
-
2026-01-19 업무: 제로원 TTS 데이터 파이프라인 및 일본어 ASR 모델 개선
-
2026-01-15 업무 및 일본어 ASR 개선 계획
-
ReturnZero Day 1749: PVI 및 일본어 ASR 개선 작업
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-06)
-
Primary Voice Isolation(PVI) 평가 환경 구축 및 신한 SDK 16kHz 대응
-
ReturnZero Day 1748: PVI 및 일본어 ASR 개선 작업
-
TTS 개선 및 S2 리빌드
-
TTS 모델 개선 및 S2 리빌드 진행 상황
-
2025-08-28 업무 우선순위 및 기술 이슈
-
Day 1426. 2025-05-26 - 업무
-
ASR 모델 개선 및 프로젝트 진행 현황 (2026-05-07)
-
2025-01-21 업무 및 프로젝트 현황
-
2026-01-27 업무: 제로원 TTS, 일본어 ASR 개선, 두나무 유지보수
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-02-27)
-
2026-01-22 업무 및 모델 개선 이슈
-
2026-01-13 업무 및 기술 노트
-
출장 정리 및 이름 모델 개선 계획 (2023-11-14)
-
2026-03-25 업무 및 기술 이슈 요약
-
ReturnZero Day 1756: PVI 및 일본어 ASR 개선 이슈
-
ReturnZero 리서치 프로젝트 현황 (2022-01)
-
Day 937: 다드미 버그 수정, 일본어 데이터 수집, 특허 보완
-
2023-08-08 작업 일지: 일본어 학습, MWW 배포, Dadumi
-
2023-02-24 작업 기록: 일본어 STT 조사 및 통합 ITN 설계
-
NLP 팀 회의 및 다음 작업 아이템 (2022-05-12)
-
2026-05-28 업무 및 기술 이슈 요약
-
ASR 모델 개선 현황: PVI, 일본어, 화물맨 도메인
-
Primary Voice Isolation(PVI) 및 일본어 ASR 개선 현황
-
2026-01-30 업무: 일본어 ASR 개선, 제로원 데이터 처리, 두나무 인프라 이슈
-
2025-11-18 업무: Pacman 개선, MWW 점검, AI Agent 방향성 고민
-
KISA 프로젝트 준비 및 일본어 STT 모델 실험 (Day 1570)
-
2025-10-16 업무: 일본어 STT 실험 및 KISA 프로젝트 준비
-
2025-09-10 업무 우선순위 및 이슈 (일본어 배포, dadumi, 현대캐피탈)
-
SIMS 암호화 구현 및 다국어 모델 파이프라인 논의
-
2025-06-17 업무 진행 사항 (Pacman, 두나무, SIMS)
-
2025-06-05 업무: SIMS 로깅, dadumi 에러 분석, 현대캐피탈 현행화 준비
-
2025-01-22 업무 진행 사항: 팩맨 저장소 변경, 워커 테스트셋 구조 개선, 코드 리뷰
-
2025-01-16 업무 및 프로젝트 현황
-
한중일 한자 발음 매핑 및 데이터베이스 구축 구상
-
polyglot-ko 서빙 준비도
-
일본어 음성 전사 파이프라인 설계 및 고려사항
-
2023-08-28 일일 작업 기록: 일본어 데이터 분석, 현대캐피탈 장애 대응, GPU Operator 설치
-
2026-05-21 업무: PVI 및 일본어 ASR 모델 개선 현황
-
Primary Voice Isolation (PVI) 파이프라인 개선 및 일본어 ASR 모델 이슈
-
ReturnZero Day 1743: PVI, 일본어 ASR 개선 및 신한 SDK 빌드
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 계획
-
S2 리빌드 및 스택빌더(S2 Rebuild & StackBuilder) 개발 현황
-
2025-11-21 업무: 두나무 인프라 장애, Pacman 차트 개선, MWW 대응
-
rtzr-stt Pacman 개선 및 부산소방 이슈 대응 (2025-11-10)
-
일본어 음성 인식 파인튜닝: 문자셋 재정의 및 데이터 혼합 비율 조정
-
2025-02-06 업무 및 기술 검토 (팩맨, 두나무, MWW)
-
신한카드 RFI 대응 및 STT 엔진 개발 현황 (Day 1034)
-
Day 904: STT 학습 기능 논의 및 배포 준비 (2023-12-21)
-
dadumi-whisper 파이프라인 개선 및 현대캐피탈 업무
-
새 일본어 고객 (Day 786)
-
ReturnZero Day 700: 샌박 테스트 결과 및 일본어 STT 프로젝트 현황
-
어제를 사는 힘 (2025-11-18)
-
ITN 개발 및 에이전트 아키텍처 논의 (Day 680)
-
Day 610: 태스크 정리 (NLP4STT, 다듬이, 일본어 데이터)
-
2022-12-26 회사 근황 및 NLP 기술 검토
-
일본어 숫자 및 날짜 처리 로직 개선 (Day 533)
-
신한은행 인프라 연동 및 라벨링 파이프라인 논의
-
TTS 후순위 전환 및 ASR 집중 전략 수립 (2022-05-23)
-
2026-05-15 업무: PVI, 일본어 ASR, MWW 배포 이슈
-
PVI 최적화 및 일본어 ASR 모델 개선 현황 (2026-05-06)
-
PVI 최적화 및 일본어 ASR 모델 개선 현황 (2026-04-29)
-
PVI 성능 최적화 및 일본어 ASR 모델 개선 현황
-
ReturnZero Day 1762: PVI 및 일본어 ASR 개선 현황
-
2026-04-22 업무: PVI, 일본어 ASR 개선 및 Silero VAD 평가
-
ReturnZero Day 1736: PVI 및 일본어 ASR 개선 현황
-
Primary Voice Isolation 및 일본어 ASR 개선 현황 (2026-03-31)
-
TTS 모델 개선 및 S2 리빌드
-
TTS 모델 개선 및 S2 리빌드
-
2026-02-08 업무: 일본어 ASR 모델 개선 및 웰컴 프로젝트 인프라 구축
-
2026-01-29 업무: 일본어 ASR 모델 개선 및 제로원 데이터 이슈
-
2026-01-26 업무: 제로원 준비 및 일본어 ASR 개선
-
2026-01-21 업무: 제로원 TTS 데이터 정제 실패 및 일본어 STT 모델 개선 계획
-
2026-01-16 업무: 두나무 STT 연동 장애 및 일본어 모델 개선
-
2026-01-14 업무 및 일본어 모델 배포 준비
-
RTZR 일본어 ASR 개발 이력 및 모델 레지스트리 구조
-
ReturnZero Day 1623: STT 파이프라인 개선 및 인프라 자동화
-
2025-08-21 업무: 현대캐피탈 고도화, utterance 암호화, Next Model 배포
-
ReturnZero Day 1500: 현대캐피탈 고도화 및 utterance_save 암호화 구현
-
2025-06-16 업무 진행 사항 (Pacman, 두나무, SIMS, MWW)
-
2025-06-10 업무 기록: SIMS 빌드 환경, Pacman 모델 평가, 신한카드 컨테이너 오류
-
두나무 업무 및 차트 리팩토링 계획 (Day 1338)
-
2024-09-30 업무 일지: 신한카드 및 서울소방재난본부 프로젝트 진행 상황
-
일본어 ASR 모델 학습 및 데이터 전처리 진행 상황 (2024-07-15)
-
폰 데이터 이전 및 정리 체크리스트
-
ChatGPT-4o, 음성인식 및 관련 기술 탐색
-
일본어 TTS 데이터 전처리 및 학습 구성안
-
Qoo10 데이터 정규화 및 장애 대응 기록
-
일본어 ASR 파인튜닝 준비 및 코드 수정
-
rt-dadumi aligner
-
ITN 모델 최적화 및 데이터 전처리 작업 기록
-
NLP4STT: ITN 및 띄어쓰기 후처리 개선
-
ReturnZero Day 1794: PVI 및 일본어 ASR 개선 현황
-
일본어 ASR 이슈 및 UBase 타운홀 요약
-
PVI 및 일본어 ASR 모델 개선 현황 (2026-05-22)
-
PVI 모델 개선 및 일본어 ASR 이슈 분석
-
2026-04-09 업무: PVI, 일본어 ASR 개선 및 TTS 관리 기능 개발
-
Primary Voice Isolation(PVI) 및 신한은행 다국어 ASR 대응 현황
-
SIMS Docker Compose 전환 및 S2 리빌드 현황
-
TTS 모델 개선 및 S2 리빌드 진행
-
2026-02-03 업무: 일본어 ASR 모델 개선 및 Triton 배포 환경 최적화
-
OpenSearch
-
일본어 데이터 전사 비교 및 정규화 로직 수정
-
2025-09-30 업무 및 시스템 복구 현황
-
2025-09-26 현대캐피탈 현장 방문 및 STT 서비스 상태 확인
-
2025-09-16 일본어 모델 배포 및 설정 작업
-
2025-08-26 업무 진행 사항: sommers ja 테스트, 현대캐피탈 고도화, utterance_save 암호화
-
학습 파이프라인 개선
-
현대캐피탈 고도화 운영 준비 및 SIMS 암호화 구현 현황
-
2025-06-04 업무 진행 상황: 두나무, SIMS, zLogger, 현대캐피탈 및 영업 현황
-
Istio 네트워크 문제 조사
-
일본어 STT 모델 튜닝 및 팀벨 서비스 장애 대응
-
Parquet 오디오 데이터 추출 및 전처리 스크립트
-
신뢰통신 과제 워크샵(4차) 핵심 요약
-
MWW VAD 임계값 수정 및 테스트
-
2023 년 1 월~12 월 업무 회고 및 일본어 ITN 개발 이력
-
일본어 STT 개발계 배포 및 벤치마크 실행 기록 (Day 872)
-
일본어 데이터 전처리 및 정제 규칙 (Day 790)
-
MWW K8s Batch Cronjob 해제 및 현대캐피탈 방문 준비
-
주소 모델 개발 현황
-
2023-05-12 일본어 모델 학습 및 얼라인, ITN 서비스화 진행 상황
-
NLP4STT 프로젝트 마무리 및 팀원 이탈 회고
-
PVI 모델 최적화 및 일본어 ASR 개선 현황 (2026-05-27)
-
ReturnZero Day 1765: PVI 및 일본어 ASR 모델 개선 현황
-
PVI 성능 개선 및 일본어 ASR 모델 이슈 분석
-
Primary Voice Isolation (PVI) 성능 평가 및 일본어 ASR 개선 계획
-
TTS 개선 및 S2 리빌드
-
TTS 모델 개선 및 제로원 준비
-
RTZR 일본어 STT 개발 이력 및 인프라 현황
-
RTZR 일본어 STT 개발 이력 및 모델 레지스트리 구조
-
Day 1590. 2025-11-06 - 업무 진행 상황
-
SIMS 모델 배포 및 게이트웨이 설정 작업
-
2025-10-14 업무: 일본어 STT 튜닝 실험 및 제로원 제안서 초안
-
일본어 데이터 전사 이슈 및 두나무 로깅 아키텍처
-
2025-09-23 업무: 일본어 배포 및 서울소방 로그 분석
-
2025-08-22 업무: 현대캐피탈 고도화, 암호화 구현, Next Model 디버깅
-
현대캐피탈 고도화 및 utterance_save 암호화 구현 현황 (2025-08-05)
-
03 환경 구축 및 모델 데이터 이전
-
현대캐피탈 고도화: 취약점 패치 및 다중 모델 평가 환경 구축
-
현대캐피탈 고도화 및 utterance 암호화 구현 현황
-
2025-05-27 업무 진행 사항 (두나무, 신한카드, 팩맨 빌더)
-
2025-03-31 업무 및 조직 현황
-
2025-03-10 업무 진행 사항 (팩맨, 두나무)
-
2025-01-20 업무 및 2024 하반기 회고
-
2025-01-08 업무 및 기술 노트
-
2024-11-29 업무 기록: 일본어 모델 개선 및 PII 버그 수정
-
2024-08-13 업무 및 프로젝트 진행 상황
-
Excalidraw Drawing (2026-01-01)
-
한국)
-
ReturnZero 프로젝트 관련 기술 링크 모음
-
MWW 한국어 SIMS 평가 및 커넥션 릭 재현 테스트
-
Whisper Dadumi 대응 및 언어 정보 처리
-
일본어 관련 의심 단어 목록 및 정제 규칙
-
대방 방문 작업 목록 및 기술적 이슈 (2023-08-16)
-
qoo10 일본어 서버 재가동 및 헬름차트 설정
-
다듬이 마무리 (Day 702)
-
일본어 처리 이슈
-
Callabo STT 성능 개선 및 일본어 Qoo10 데이터 얼라인 전략
-
ITN 서비스 배포 및 VAD 통합 구성 검토
-
일본어 ASR 얼라인 및 ITN 파이프라인 개발 (Day 635)
-
CD 및 Transcriber 최적화 진행 상황
-
ITN 이슈: CTM 정보 복구
-
ReturnZero Day 1785: PVI, 일본어 ASR 개선 및 MWW 배포
-
TTS 기술 이슈 (2026-05-19)
-
Primary Voice Isolation(PVI) 및 신한은행 다국어 STT 대응 현황
-
Primary Voice Isolation 연구 계획 및 VAD 개선 방향
-
2026-03-09 업무 및 S2 리빌드 현황
-
2026-02-02 업무: 일본어 ASR 모델 개선 및 제로원 데이터 처리
-
2026-01-02 업무 및 제로원 TTS TN 프로젝트 킥오프
-
ReturnZero STT 솔루션 개발 및 모델 레지스트리 구조화
-
SIMS 일본어 설치 및 현대캐피탈 모델 고도화 진행 상황
-
현대캐피탈 고도화 이슈 대응 및 utterance_save 암호화 구현
-
현대캐피탈 고도화 및 utterance_save 암호화 구현 현황 (2025-08-06)
-
현대캐피탈 고도화 및 utterance_save 암호화 구현 현황 (2025-08-04)
-
현대캐피탈 고도화 및 utterance 암호화 구현 진행 상황
-
처리 워크플로우
-
2025-05-21 업무: 두나무 Sentry, SIMS 감사, IBK 배포, 인텔 PoC 결과
-
신한카드 프로젝트: 온프레미스 인프라 및 SRE 운영 현황
-
2024-09-04 업무 진행 상황 및 아이쏠라 운영계 준비
-
2024-08-14 업무 및 프로젝트 진행 상황
-
Day 1104 (2024-07-09) - ReturnZero Daily Note
-
보고서 수정 및 재구성 작업 목록
-
세션 관리 이슈
-
stamcord 아키텍처 개선 및 하드웨어 프로젝트 메모
-
2017-06-26 일지: 이더리움 손절 및 distributed-workerpool 개발
-
리턴제로: 오디오 SNS 및 아바타 메타버스 프로젝트 구상
-
테스트 진행 상황 (Day 965)
-
Day 946: YouTube 데이터 파이프라인 실험 및 Worker 테스트 이슈
-
dadumi한테 어떻게 task를 줄건데
-
일본어 NLP 화이트리스트 및 배포 기록
-
현대 캐피탈 프로젝트 마무리 및 대용량 파일 처리
-
Alignment 설명
-
2023-03-23 작업 기록: 일본어 ITN 및 Qoo10 ASR 정렬
-
Day 588: 띄어쓰기 교정 실험 및 KAIST 채용 심사 기록
-
2022-12-13 작업 기록: NLP 파이프라인 디버깅 및 일본어 ITN 통합
-
ReturnZero Day 488: 팀 기조 변경 및 NLP 전략 재정의
-
ASR 방향성 회의 및 3i4k 환경 구축 삽질
-
Pysommers BMT CER 계산 및 화자 구분 세미나 노트
-
Primary Voice Isolation (PVI) 연구 계획서
-
한국어 TTS 정규화 모델 개발 및 일본어 ASR 개선 현황
-
ReturnZero Day 1651: 업무 현황 및 제로원 TTS TN 정책 정의
-
2025-11-11 업무 및 기술 노트
-
비즈니스 현황 (2025-10-23)
-
2025-10-15 업무 및 일본어 ASR 모델 평가
-
현대캐피탈 고도화 및 일본어 모델 개발 진행 상황 (Day 1524)
-
2025-08-25 업무: 현대캐피탈 TTS 장애, utterance 암호화, 일본어 모델 디버깅
-
현대캐피탈 고도화: utterance_save 암호화 구현 진행 상황
-
일본어 주소 인식 모델 배포 및 MWW STT 성능 검증
-
인프라 구축 현황
-
현대캐피탈 OS 변경 대응: STT 및 라이선스 서버 디렉토리 이관 목록
-
Day 1009: 팀벨 레이턴시 이슈 및 일본어 E2E 세그멘테이션
-
Pronaia 온프레미스 세미나 준비 및 데이터 파이프라인 문제 해결
-
팀벨 (2024-03-28)
-
홈서버 인프라 현황 및 개선 계획
-
다듬이: 음성 텍스트 전처리 로직 개선
-
일본어 TMN 회의 및 팀벨 클러스터 작업
-
Day 852: 현대캐피탈 방문 및 use_vad_event 배포 준비
-
Day 800: 세팅 및 ITN 워커 스펙 변경
-
ASR 파싱 및 인프라 요구사항 (Day 791)
-
일본어 ASR 데이터 전처리 및 Pronaia 메시지 구조 정의
-
dadumi
-
ITN Triton 통합 배포 및 스레드 풀 문제
-
rt-gec 토크나이저 이슈 및 일본어 ITN 학습 데이터 가이드라인
-
통합 ITN(다듬이) 아키텍처 및 프로젝트 현황
-
ReturnZero E2E 파이프라인 실행 순서 및 데이터 구조 분석
-
MLOps 인프라 및 데이터 과학 공정 현황 (Day 251)
-
다국어 RTFx 성능 측정 및 S2 리빌드 현황
-
한국어 TTS 텍스트 정규화(TN) 경량 모델 개발 진행 상황 (2026-02)
-
ReturnZero Day 1653: Speech Stack 개선 및 타운홀 전략 회고
-
신한카드 K8s 방화벽 설정 및 모델 파이프라인 개선 고민
-
2025-10-13 업무: 일본어 STT 모델 검증 및 제로원 제안서 초안
-
2025-09-02 업무: 일본어 T4, 현대캐피탈 고도화, utterance 암호화
-
2025-08-12 업무 진행 상황: 현대캐피탈, utterance 암호화, Next Model, 신한카드, 쿠팡 PoC
-
현대캐피탈 고도화: 반입 준비, 취약점 스캔, utterance 암호화 구현
-
현대캐피탈 고도화 프로젝트: MWW 회의 및 인프라 설치 계획
-
2025-05-29 업무 및 타운홀 기록
-
신한은행 업무 현황
-
Day 14. 2021-07-14
-
Day 1380. 2025-04-10 - 업무
-
두나무)
-
2025-03-05 업무 진행 사항 및 TODO
-
2024-12-12 업무 및 신한카드 아이쏠라 배치 준비
-
신한카드 프로젝트: STT 이슈 대응 및 PII 개선 회고
-
2024-08-05 업무 및 인프라 설정 기록
-
ReturnZero Day 1061: STT 엔지니어링 및 평가 현황
-
Timbel 전사 속도 최적화: VAD Trailing Time 조정
-
2025-02-05 일지: 업무, 투자 리밸런싱, 개발 및 개인 기록
-
발표 스킬 및 연구 이슈 정리 (2019.12.17)
-
Stock Trader 데이터 준비 및 아키텍처 검토
-
TMN 음성 인식 오류 분석 및 개선 과제 (2024-04-09)
-
신한 완판 프로젝트: 화자 분리 및 실시간 전사 킥오프
-
한국어 배포 준비
-
ITN 배포용 메트릭 설정 및 K8s 테스트베드 구축
-
일본어 이름 모델 검증 및 T4 배포 준비
-
일본어 NLP 데이터 정제 및 운영 라이선스 발급
-
ITN: 텍스트 토크나이징 및 인퍼런스 파이프라인 개선
-
일어 음성 처리 파이프라인 디버깅 및 ITN 수정
-
다듬이 올인: 문장 처리 파이프라인 및 말풍선 병합 로직 설계
-
ITN 파이프라인 통합 및 일본어 정규화 작업 현황 (Day 602)
-
ReturnZero Day 594: 일본어 데이터 파이프라인 및 ITN 아키텍처 검토
-
NLP4STT: Neural ITN Triton화 및 배치 처리
-
ASR-ITN 파이프라인 최적화 및 재학습 전략 논의
-
ReturnZero Day 532: Kiwi 모델 검증 및 일본어 숫자 태깅 규칙 분석
-
Day 497. 2022-11-09
-
WFST 인터페이스 및 파인튜닝 진행 상황 (Day 383)
-
AB 사업 리뷰 및 KISA 클러스터 IP 이전
-
2025-06-02 업무 진행 사항 (두나무, SIMS, zLogger, Stack-Builder)
-
팩맨 프로젝트 인프라 및 배치 작업 현황 (Day 1316)
-
2025-01-06 업무 일지: 일본어 음성 데이터 소스 비교 및 파이프라인 이슈
-
스케줄링 이슈
-
Gemma2 기술 검토
-
MWW 일본어 배포 및 가독성 평가 실험 (2024-07-24)
-
PII 영향 분석)
-
ReturnZero Day 1058: ASR 파이프라인 진행 상황 및 버그 수정
-
RTBoost Dataset VAD 오류 및 전처리 파이프라인 수정
-
현택의 블록체인 기반 데이터 거래 모델 고찰
-
한국어 모델 업데이트 및 ITN 테스트 환경 준비
-
STT 성능 벤치마킹 및 특허 기술 아이디어 정리
-
일본어 ASR 모델 실험 및 데이터 파이프라인 개선 (Day 811)
-
Day 8. 2021-07-08
-
2023-09-07 작업 기록: 일본어 ASR 모델 학습 및 MWW 업무
-
주소 교정 (Address Correction)
-
일본어 ASR 모델 디버깅 및 성능 비교 (Day 704)
-
다듬이: Turn 기반 처리 파이프라인 재설계 및 Pandas 인덱스 문제
-
일본어 ASR 프로젝트 현황 및 전략 논의 (Day 627)
-
통합 ITN 인터페이스 통일 및 일본어 프로젝트 일정 조정
-
ITN 성능 병목 분석 및 일본어 전사 개선 방향
-
Total ensemble model
-
2023-01-05 일지: pysommers 배포 문제 해결, NLP4STT 띄어쓰기 모델 최적화 및 사업계획
-
NLP4STT 점검: ITN, TER 메트릭 및 테스트셋 구축
-
ReturnZero Day 495: 화자 분리 실패와 룰 기반 FP 감수
-
NLP 모델 오류 패턴 분석 및 개선 방안 (2022-10-28)
-
아서의 튜토리얼 - bmt 사용법
-
Day 372 (2022-07-07) 작업 기록
-
Day 303: 모델 이미지 재배포 및 TTS 연구 시작
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
2025-11-03 업무: 두나무 Audit, 오뚜기 모델, 부산소방 연동
-
현대캐피탈 배포 및 제로원 프로젝트 킥오프
-
utterance_save 암호화 구현 및 SIMS 파이프라인 수정
-
2025-05-19 업무 진행 사항: 두나무 재전사, SIMS 감사 기능, IBK PoC
-
2025-04-30 업무: 두나무 장애 및 농협 PoC 진행
-
두나무 업무 진행 사항 (2025-04-07)
-
이슈 대응 (2025-04-01)
-
Sims 프로젝트 기술 이슈 및 인프라 조정 (2025-03-12)
-
타운홀)
-
2025-01-17 업무: 일본어 STT 벤치마크 및 VAD 튜닝
-
프로나이아 프로젝트 및 인프라 운영 일지 (Day 1287)
-
SIMS 0.4.0 배포 시험 및 설정 검토
-
2024-11-28 업무 및 실험 기록
-
VITO 요약 회의 및 RoBERTa 의도 분석 모델 논의
-
팀벨(Timbel) 평가(Eval) 시스템 디버깅 및 인프라 설정
-
TMN 회의: 일본어 4자리 숫자 인식 오류 분석
-
음성 데이터 전사 및 변환 작업 현황 (2024-05-22)
-
Pronaia Engine Keyword Boosting 모델 전사 테스트 및 배포 준비
-
유튜브 자막 전사 데이터 손실 및 저장소 오류
-
MWW 한국어 STT 배포 및 SIMS Backend 아키텍처 검토
-
Day 942: vito-worker 배포 및 STT 파이프라인 설정
-
Pronaia Online 서비스 운영 및 리소스 모니터링
-
mww 운영계 배포 아키텍처 및 구성 요소
-
Vocab 실험 및 작업량 분석
-
Day 875. 2023-11-23
-
Day 851: 팀벨 미팅 및 현대캐피탈 운영 이슈
-
Day 820. 2023-09-28
-
일본어 Neural ITN 및 4090 환경 빌드 시도
-
일본어 ASR 모델 평가 및 rt-itn 배포 기록
-
2023-07-05 작업 계획 및 MWW 연동 이슈 해결
-
일본어 TTS 기반 학습 및 주소 전사 실험 노트
-
ITN 논의
-
Day 665: ITN 모델 배포 장애 및 환경 정리
-
ITN 성능 벤치마크 및 토큰화 버그 분석
-
다듬이: 텍스트 처리 파이프라인 성능 최적화 및 병렬화 실험
-
일본어 ASR 파이프라인 설정 및 실험 기록
-
Day 58 (2021-08-27): 벨 프로젝트 인수 및 EFS 장애 대응
-
Triton Ensemble 구현 및 NLP4STT 띄어쓰기 이슈
-
일본어 ITN(숫자 읽기) 디버깅 및 워커 개발
-
일본어 NLP 파이프라인 디버깅 및 코퍼스 구축
-
Kiwi 형태소 분석기 학습 데이터 확보 및 일본어 ITN 개발 현황
-
Kiwi NLP 모델 빌딩 및 데이터 전처리 작업 기록
-
NLP4STT: 교정 전후 문자열 매핑 및 띄어쓰기 복원 알고리즘
-
2022-07-11 일일 작업 기록: Pynini 트랜스듀서 디버깅 및 MariaDB 환경 설정
-
프로젝트 현황 (Day 36)
-
3i4k VTS 데이터 전처리 및 BMT 음성 전사 이슈
-
TTS 연구 파이프라인 정의 및 Project-K 협업 회고
-
gip-decoder 배포 및 TTS 아키텍처 검토
-
일본어 주소 인식 시스템 개선 및 데이터 파이프라인 전략
-
일본어 주소 인식 시스템 개선 및 파인튜닝 전략
-
ReturnZero Day 1643: 모델 레지스트리 구조화 및 전사 장애 분석
-
KISA STT 솔루션 설치 및 환경 구성 (Day 1573)
-
일본어 ASR 모델 (Cutoff) 벤치마킹 및 배포 준비
-
2025-09-08 업무: 일본어 SIMS 배포 및 현대캐피탈 고도화 준비
-
2025-08-20 업무: 현대캐피탈 고도화, 암호화 구현, Next Model 환경 구축
-
Pronaia Multilang 배포 디버깅 및 utterance_save 암호화 구현
-
2025-08-11 업무: 현대캐피탈 고도화, utterance_save 암호화, Next Model, 신한카드
-
두나무 과거 데이터 전사 작업 중 용량 및 SSO 이슈
-
두나무 STT 프로젝트 진행 현황 및 개인정보 처리 법률 검토
-
두나무 개인정보처리시스템 요건 및 녹취 데이터 마이그레이션 논의
-
팩맨 프로젝트: 환경별 배포 전략 및 설치 표준화
-
2024-11-27 작업 기록: 일본어 BMT 실험 및 Pronaia 서버 리팩토링
-
신한카드 프로젝트: vito-worker 배포 및 전사 오류 분석
-
MWW EKS Bastion 접속 및 GitLab 설정 장애 대응
-
MWW EKS 환경 접속 및 배포 준비 (Day 1153)
-
Vito STT 성능 벤치마킹 및 환경 설정 기록 (2024-07-01)
-
ReturnZero Day 1047: 일본어 ASR 모델 검증 및 성능 분석
-
멀티뷰 학습 및 vLLM 서빙 엔진 탐색
-
2026-02 송도 현재 상황
-
llm-cli-gateway MCP 및 Async Skill 전역 설정 가이드
-
일본어 음성 인식(ASR) 전사 파이프라인 디버깅 및 경량화 시도
-
MWW 배포 및 ASR 파이프라인 디버깅 (2024-03-12)
-
SIMS 개발계 배포 및 Envoy gRPC 로드밸런싱 설정
-
ReturnZero Day 958: 한자 인식 성능 평가 및 VAD 파라미터 튜닝
-
SIMS 헬름 구성 및 파이프라인 자동화 고민