스크립트를 입력받아 자동으로 타이핑하는 기계에 대한 아이디어를 기록한 노트다. 초기 구상인 ‘각 키에 모터 달기’는 예산 문제로 비현실적이라고 판단하고, ‘전기 신호로 블록 모양 생성’이라는 대안적 접근을 제시한다. 하드웨어 구현의 비용과 구동 방식에 대한 초기 고민 과정이 담겨 있다.
-
무선 발열 슬리퍼 - 배터리 장착 방식
-
dadumi한테 어떻게 task를 줄건데
-
매크로 (ReturnZero)
-
GOP 개발 및 기술적 고민 (2022-07-13)
-
프로젝트 일람 (책기록기, 이클립스, 심플렛저)
-
소설 아이디어: 자기 파라미터 고치기
-
WFST 엔진 구현 및 Commitment 작업 (Day 392)
-
WFST 엔진 구현 및 토큰 파싱 로직 설계
-
ChatGPT-4o, 음성인식 및 관련 기술 탐색
-
AncomBase 아이디어 백로그: 가격 예측, 드걸 부활, 서적관리
-
WFST 테스트 코드 및 규칙 개발 (Day 391)
-
WFST 엔진 개발 및 토큰 태그 삽입 로직 개선 (Day 399)
-
WFST 목록화 및 의존성 구문 분석 탐색
-
FST 기반 분류기 구조 및 코드 리팩토링 (Day 435)
-
자바스크립트 및 머신러닝 관련 도서 목록
-
WFST 인터페이스 및 파인튜닝 진행 상황 (Day 383)
-
Highlighter 구조 및 패턴 감별 방식 고찰
-
어미 처리 실험
-
옵셔널 구문 설계
-
WFST 분류기 및 복합 클래스 우선순위 처리
-
WFST 최적화 및 결정화 알고리즘 검토
-
약속) 성능 분석 및 정제 전략
-
Day 390: 핵심성분 분석 및 WFST 테스트 진행
-
Day 385 (2022-07-20): WFST 개발 및 휴가 잔여일 계산
-
WFST 어미 인식 개선 및 gop-decoder S3 연동 계획
-
WFST 코드 보완 및 분류 모델 성능 평가 (Day 400)
-
WFST 규칙 최적화 및 성능 평가 (Day 404)
-
Rule-based NER 및 Semantic Role Labeling 구현 전략
-
WFST 연구 및 화행 레이블링 회의 기록 (Day 370)
-
pynini 학습 노트
-
대화 발화 병합 및 규칙 기반 분류 파이프라인 설계
-
ReturnZero: WFSTClassifier 리팩토링 및 명명 규칙 정리
-
NLP 라벨링 도구: 예측 및 비교 스크립트
-
Composite rule: 해시 검증의 한계와 조합 폭발 문제
-
리팩토링 요소
-
가치 있는 발화 추출의 어려움과 SAC 방향성 고민
-
Fine-tuning 개념 정리
-
수열 패턴 및 제곱근 근사 공식 탐구 (2019)
-
라벨링 가이드라인 및 카테고리 정의 (Day 478)
-
rt-itn-jp 코드 모델 및 WFST 구현 계획
-
ReturnZero: 컴포짓 클래스 및 라벨링 규칙 설계 고민
-
미팅 요약 서베이 및 화행 분석
-
3i4k 데이터셋을 활용한 화행분류 Feasibility 검토
-
Hypernetwork 구조 분석 및 한계점
-
KOF99 네스츠 데이터 기반 AI 학습 아이디어
-
TD3 기반 주식 트레이딩 알고리즘 설계
-
현택의 블록체인 기반 데이터 거래 모델 고찰
-
Qoo10 rtboost 구현 및 dadumi aligner 알고리즘 설계 고민
-
강화학습 기반 암호화폐 자동매매 프로젝트 제안
-
Callabo 회의록 기능의 방향성 재고 및 우선순위 하향 조정
-
Parquet 오디오 데이터 추출 및 전처리 스크립트
-
오프로딩: 속도 할당 및 유틸리티 함수 설계
-
SAC (Soft Actor-Critic) 강화학습 소개
-
3i4k 데이터 정제 전략 및 SAC 프로젝트 아키텍처 정의
-
STT 성능 벤치마킹 및 특허 기술 아이디어 정리
-
스트림 구현 및 아키텍처 고민
-
Confidence 구현
-
회의록 요약(Action Item 추출) 연구 서베이 및 난점 분석
-
화행 분석을 위한 한국어 형태소 분석기 평가 및 규칙 기반 접근의 한계
-
Apologize FP & Rule-Based Classifier Issues
-
리팩토링 시도: cdrewrite 및 transducer 기반 태그 삽입 성능 문제
-
RLHF(인간 피드백 기반 강화학습) 개요
-
RL 기반 주식 트레이딩 봇 설계: 에피소드 길이 및 데이터 고려사항
-
임인년 189일, 7월 8일 금요일
-
가위바위보 기반 AI 소개팅 게임 앱
-
SAC 통화 요약: 추출형 vs 생성형 요약 전략 및 평가 지표
-
Day 428. 2022-09-01
-
ReturnZero Day 482: 비즈니스 통화 스크립트 검토 및 결과 비교 실험
-
ReturnZero Day 495: 화자 분리 실패와 룰 기반 FP 감수
-
맞춤법 데이터 구조 및 토크나이징 전략 논의
-
Day 931. 2024-01-18
-
FastAPI 학습
-
비트코인 상승장 구간 정의 및 데이터 수집 계획
-
FreqAI 설정 및 커스텀 데이터 활용 가능성 탐구
-
dadumi lang 포함
-
NLP 팀 회의 및 다음 작업 아이템 (2022-05-12)
-
다듬이: Turn 기반 처리 파이프라인 재설계 및 Pandas 인덱스 문제
-
ITN 규칙 대응 및 Kiwi 기반 NLP 파이프라인 개선
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
STT 관련 고찰
-
Stock Trader 데이터 준비 및 아키텍처 검토
-
RLLib 얼라인: 학습 코드 검토 및 Google Trends 데이터 검증
-
polyglot-ko 서빙 준비도
-
Day 937: 다드미 버그 수정, 일본어 데이터 수집, 특허 보완
-
일본어 데이터 전사 비교 및 정규화 로직 수정
-
일본어 TTS 기반 학습 및 주소 전사 실험 노트
-
가독성 개선
-
미래에셋 방문 및 일본어 데이터 준비 작업
-
일본어 NLP 데이터 정제 및 운영 라이선스 발급
-
2022-12-26 회사 근황 및 NLP 기술 검토
-
Day 471. 2022-10-14
-
Recall) 이해 및 HuggingFace Transformers 학습 코드 분석
-
일본어 NLP 파이프라인 및 데이터셋 전처리 작업 기록
-
일본어 철자전사 Align 및 신한은행 프로젝트 Kickoff
-
일본어 ASR 데이터 전처리 및 Pronaia 메시지 구조 정의
-
TED 일본어 데이터셋(테스트용)
-
Day 610: 태스크 정리 (NLP4STT, 다듬이, 일본어 데이터)
-
AI 금융 및 알고리즘 트레이딩 참고 문헌
-
편의점 강도 대비 자동 조준 CCTV 구상
-
일본어 이름 모델 검증 및 T4 배포 준비
-
ReturnZero 프로젝트 관련 기술 링크 모음
-
일본어 TTS 데이터 전처리 및 학습 구성안
-
일본어 관련 의심 단어 목록 및 정제 규칙
-
T4 빌드 및 일본어 NLP 처리 방안
-
Callabo STT 성능 개선 및 일본어 Qoo10 데이터 얼라인 전략
-
다듬이: 텍스트 처리 파이프라인 성능 최적화 및 병렬화 실험
-
Project-K 지역락 이슈 및 모델 이미지 재퍼블리시
-
일본어 데이터 정제 및 전처리 파이프라인 (Day 1562)
-
폰 데이터 이전 및 정리 체크리스트
-
Greedy Confidence 및 Entropy 기반 신뢰도 추론 아키텍처
-
부채 표시)
-
AICT 문장 띄어쓰기 벤치마크 및 워커 컨테이너 테스트
-
자아와의 대화 앱 아이디어 및 건강 기록
-
ReturnZero Day 858: Confidence Score 적용 및 모델 변경
-
2023-08-08 작업 일지: 일본어 학습, MWW 배포, Dadumi
-
ITN 개발 및 에이전트 아키텍처 논의 (Day 680)
-
일본어 STT 이슈
-
rt-dadumi aligner
-
2023-03-04 작업 진행 사항 (NLP4STT, 일본어 데이터셋, rt-dadumi)
-
3i4k 모델 성능 저하 분석 및 Pronaia 클라이언트 개발 현황
-
Day 461. 2022-10-04
-
ReturnZero Day 291: gRPC 로직 및 Ali-phone 정렬 디버깅
-
Deview 2023 1일차 키노트 및 세션 요약 (네이버, 쏘카, Clova OCR)
-
네트워크 전공자 필수 지식 목록 (초안)
-
Day 153: Jenkins 빌드 스크립트 계획 및 편두통 휴가
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
qoo10 일본어 서버 재가동 및 헬름차트 설정
-
NLP 문제 정의
-
일본어 ASR 파이프라인 구축 및 Forced Alignment 문제 해결 시도
-
ReturnZero Day 532: Kiwi 모델 검증 및 일본어 숫자 태깅 규칙 분석
-
ReturnZero E2E 파이프라인 실행 순서 및 데이터 구조 분석
-
3i4k 모델 검증 및 VTS 테스트셋 평가 전략
-
VITO 요약 회의 및 RoBERTa 의도 분석 모델 논의
-
ReturnZero Day 1147: AM 모델 학습 API 테스트
-
Day 323. 2022-05-19
-
Vocab 실험 및 작업량 분석
-
Day 897: E2E 테스트, 데이터 증강 및 LM 적용 논의
-
일본어 STT 개발계 배포 및 벤치마크 실행 기록 (Day 872)
-
ASR 파싱 및 인프라 요구사항 (Day 791)
-
Day 372 (2022-07-07) 작업 기록
-
일본어 데이터 전처리 및 정제 규칙 (Day 790)
-
ReturnZero Day 686: 큐 병목 및 Worker 성능 저하 대응
-
Day 61 (2021-08-30) - ReturnZero 일지
-
ASR-ITN 파이프라인 최적화 및 재학습 전략 논의
-
프로젝트 Bled 중단 및 SAC 프로젝트 집중
-
프로나이아 패키지화 및 3i4k FP 검증
-
2025-09-23 업무: 일본어 배포 및 서울소방 로그 분석
-
일본어 STT 모델 벤치마킹 및 인프라 작업 기록 (2025-01-14)
-
일본어 프로젝트 진행 상황
-
2024-09-19 업무: 일본어 STT 모델 튜닝 및 Prefix Decoder 디버깅
-
ReturnZero Day 1058: ASR 파이프라인 진행 상황 및 버그 수정
-
일본어 데이터셋 구축 및 전사 파이프라인 디버깅
-
최락권 박사님 세미나: 영상 품질 평가(QA) 및 시각 인지 모델
-
2024-05-07 일기: 플로이드-워셜 알고리즘 학습
-
한중일 한자 발음 매핑 및 데이터베이스 구축 구상
-
강화학습 기본 개념 정리 및 의문점
-
RAPA 과제: AI 기반 음성인식 후보정 및 데이터셋 구축
-
Day 902: Audio Feature Extraction & Model Check
-
Whisper Dadumi 대응 및 언어 정보 처리
-
Qoo10 일본어 ASR 파이프라인 및 엔진 성능 테스트 (Day 797)
-
일본어 ASR 파인튜닝 준비 및 코드 수정
-
다듬이 마무리 (Day 702)
-
Alignment 설명
-
ReturnZero Day 640: 텍스트 처리 파이프라인 리팩토링 및 세그멘테이션 이슈
-
일본어 ASR 얼라인 및 ITN 파이프라인 개발 (Day 635)
-
ITN 모델 최적화 및 데이터 전처리 작업 기록
-
Kiwi NLP 모델 빌딩 및 데이터 전처리 작업 기록
-
Day 369. 2022-07-04
-
2022-06-20 워크샵 및 모델 실험 기록
-
일본어 음성 인식 파인튜닝: 문자셋 재정의 및 데이터 혼합 비율 조정
-
2025-09-16 일본어 모델 배포 및 설정 작업
-
일본어 ASR 모델 학습 및 데이터 전처리 진행 상황 (2024-07-15)
-
ReturnZero 데이터셋 전처리 및 pysommers 파이프라인 디버깅
-
개인정보 수집 오남용 및 연구 방법론 검토 (2023-10-20)
-
STT-LLM-TTS 챗봇 기술 스택 및 설정 초안
-
리턴제로: 오디오 SNS 및 아바타 메타버스 프로젝트 구상
-
ReturnZero 리서치 프로젝트 현황 (2022-01)
-
다듬이: 음성 텍스트 전처리 로직 개선
-
Day 875. 2023-11-23
-
NLU 기술 동향 및 전시회 메모
-
새 일본어 고객 (Day 786)
-
일본어 데이터셋 전환 및 Quota 서비스 로직 수정
-
일본어 NLP 파이프라인 디버깅 및 코퍼스 구축
-
Kiwi 형태소 분석기 학습 데이터 확보 및 일본어 ITN 개발 현황
-
맞춤법 검사 자동화 봇 및 데이터 파싱 로직
-
ReturnZero 분류 모델 성능 보정 실험 (Day 401)
-
Day 301. 2022-04-27
-
삼성 마지막 날: GRPC 서버 개발 및 TTS 요구사항 정의
-
2025-10-16 업무: 일본어 STT 실험 및 KISA 프로젝트 준비
-
어제를 사는 힘 (2025-12-19)
-
ReturnZero 일본어 배포 및 문서 수정 (Day 1545)
-
Day 1106. 2024-07-11 업무 요약
-
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
-
Excalidraw Drawing (2026-01-01)
-
Tensortrade의 Gymnasium 및 Ray 호환성 개선
-
TentTrade 2.0 마이그레이션 장애요인 및 핵심 요구사항
-
CG 링크 목록
-
Kaldi 기반 GoP(Goodness of Pronunciation) 구현 분석 및 코드 탐색
-
일본어 음성 전사 파이프라인 설계 및 고려사항
-
mel2vec 영숫자 인식 성능 검증 및 패딩 실험 결과
-
Day 904: STT 학습 기능 논의 및 배포 준비 (2023-12-21)
-
Day 847: Triton 테스트 환경 구축 및 특허 전략 논의
-
일본어 ITN 테스트 및 데이터 문제 확인
-
Day 8. 2021-07-08
-
일본어 NLP 화이트리스트 및 배포 기록
-
2023-08-22 작업 일지: 일본어 데이터 전처리 및 Pronaia 테스트 환경 구축
-
주소 모델 개발 현황
-
ITN 수정 및 토크나이징 성능 최적화 고민
-
오전 업무 스몰토크 (Day 597)
-
Total ensemble model
-
ReturnZero Day 359: Python Client 완료 및 3i4k 데이터 FP 검증 시작
-
Day 335. 2022-05-31
-
GoP 발음 평가 및 NLP 과제 방향성 재정의
-
Triton-Kaldi ASR 파이프라인 개선 및 스트레스 테스트 계획
-
Day 212. 2022-01-28
-
ReturnZero Day 1749: PVI 및 일본어 ASR 개선 작업
-
Primary Voice Isolation 및 일본어 ASR 개선 과제
-
S2 리빌드 문서화 및 일본어 STT 모델 개선 과제
-
rtzr-stt Pacman 개선 및 VAD 필터 기술 검토
-
일본어 ASR 모델 (Cutoff) 벤치마킹 및 배포 준비
-
Day 1036: 상태 확인 및 기술적 장애물
-
신한카드 RFI 대응 및 STT 엔진 개발 현황 (Day 1034)
-
RTBoost Dataset VAD 오류 및 전처리 파이프라인 수정
-
기가코리아 개발 회의
-
TensorTrade 2.0 적용 및 RL 에이전트 디버깅
-
강화학습 봇 재고
-
Ancom Workbench
-
premi.st 와 개인 블로그, 사이트