이 노트는 Kirton Adaption-Innovation Inventory(KAI) 검사의 비공식적인 설명과 해석 가이드를 담고 있습니다. KAI는 문제해결 및 의사결정 시 개인이 선호하는 방식(적응형 vs 혁신형)을 측정하는 도구로, MBTI나 Big5와 달리 오직 문제해결 스타일에만 초점을 맞추며 시간이 지나도 일관된 결과를 보입니다. 핵심 주의사항으로, 이 점수는 ‘능력’이 아닌 ‘선호도’이며, 절대적인 점수(score)가 아닌 상대적인 지수(index)로 해석해야 합니다. 또한 팀 내 갈등 해소를 위해 구성원의 다양한 KAI 지수를 이해하고 수용하는 것이 중요함을 강조합니다.
-
다듬이 (Day 663)
-
AICT 문장 띄어쓰기 벤치마크 및 워커 컨테이너 테스트
-
ITN 벤치마크 방법론 재고 및 키위(Kiwi) 형태소 분석 한계 분석
-
3i4k 데이터셋을 활용한 화행분류 Feasibility 검토
-
TTS 연구 파이프라인 정의 및 Project-K 협업 회고
-
화행 분석을 위한 한국어 형태소 분석기 평가 및 규칙 기반 접근의 한계
-
신한카드 프로젝트: STT 이슈 대응 및 PII 개선 회고
-
Triton-Kaldi 디코딩 아키텍처 분석 및 iVector 적응 개념 탐구
-
선생님 외부화 및 Kiwi 형태소 분석기 커스터마이징
-
IP 돌리기 및 Kiwi 한국어 띄어쓰기 규칙 분석
-
Kiwi 모델 빌더 세그먼트 폴트 디버깅 및 ITN 초기 조사
-
Kiwi 형태소 분석기 학습 데이터 확보 및 일본어 ITN 개발 현황
-
Kiwi 형태소 분석기 모델 학습 및 N-gram 언어모델 이론 정리
-
ITN 규칙 대응 및 Kiwi 기반 NLP 파이프라인 개선
-
Day 516. 2022-11-28: Kiwi 모델 구축 API 화 및 콜라보 하이라이터 프로토타이핑
-
Kiwi 형태소 분석기 모델 학습 및 데이터 변환 프로세스
-
Kiwi NLP 모델 빌딩 및 데이터 전처리 작업 기록
-
Qwen 모델에 대한 JAILBREAK 프롬프트 시도
-
ITN 배포용 메트릭 설정 및 K8s 테스트베드 구축
-
ITN-JP 숫자 변환 및 테스트셋 구축 (Day 535)
-
일본어 NLP 파이프라인 디버깅 및 코퍼스 구축
-
NovelAI 무료 사용법 및 프롬프트 가이드
-
3i4k 데이터 정제 전략 및 SAC 프로젝트 아키텍처 정의
-
2022-12-13 작업 기록: NLP 파이프라인 디버깅 및 일본어 ITN 통합
-
NLP4STT: ITN 및 띄어쓰기 후처리 개선
-
ITN: 텍스트 토크나이징 및 인퍼런스 파이프라인 개선
-
Day 527. 2022-12-09
-
FastAPI 학습
-
ITN 이슈: CTM 정보 복구
-
ITN 성능 병목 분석 및 일본어 전사 개선 방향
-
일본어 ITN 테스트 및 데이터 문제 확인
-
NLP4STT: Neural ITN Triton화 및 배치 처리
-
일어 음성 처리 파이프라인 디버깅 및 ITN 수정
-
일본어 ITN(숫자 읽기) 디버깅 및 워커 개발
-
ITN 수정 및 토크나이징 성능 최적화 고민
-
ITN 성능 벤치마크 및 토큰화 버그 분석
-
일본어 ITN 포팅 착수 및 띄어쓰기 복원 알고리즘 고민
-
일본어 처리 이슈
-
NLP4STT 점검: ITN, TER 메트릭 및 테스트셋 구축
-
Recall) 이해 및 HuggingFace Transformers 학습 코드 분석
-
일본어 Neural ITN 및 4090 환경 빌드 시도
-
ITN 논의
-
일본어 Pronaia 배포 및 ITN 파이프라인 실험
-
Korean Spacing Algorithm Bug: Merged Phrase Overlap
-
ITN 모델 최적화 및 데이터 전처리 작업 기록
-
VITO 요약 회의 및 RoBERTa 의도 분석 모델 논의
-
일본어 데이터 전처리 및 ITN 방침 (Day 623)
-
통합 ITN(다듬이) 아키텍처 및 프로젝트 현황
-
통합 ITN 인터페이스 통일 및 일본어 프로젝트 일정 조정
-
일본어 ITN (Inverse Text Normalization) 처리 규칙 및 문제점
-
2023 년 1 월~12 월 업무 회고 및 일본어 ITN 개발 이력
-
다듬이: 일본어 ITN 및 배포 준비
-
ITN 서비스 배포 및 VAD 통합 구성 검토
-
ReturnZero Day 594: 일본어 데이터 파이프라인 및 ITN 아키텍처 검토
-
Day 800: 세팅 및 ITN 워커 스펙 변경
-
통합 ITN 및 S2 Phase 1 진행 상황 (2023-06-05)
-
TMN 회의: 일본어 4자리 숫자 인식 오류 분석
-
Alignment 설명
-
레벤슈타인 거리 (Levenshtein Distance) 알고리즘
-
ASR-ITN 파이프라인 최적화 및 재학습 전략 논의
-
Total ensemble model
-
2023-05-12 일본어 모델 학습 및 얼라인, ITN 서비스화 진행 상황
-
2023-02-24 작업 기록: 일본어 STT 조사 및 통합 ITN 설계
-
한국어 모델 업데이트 및 ITN 테스트 환경 준비
-
2023-03-23 작업 기록: 일본어 ITN 및 Qoo10 ASR 정렬
-
ITN 파이프라인 통합 및 일본어 정규화 작업 현황 (Day 602)
-
rt-gec 토크나이저 이슈 및 일본어 ITN 학습 데이터 가이드라인
-
일본어 ITN 서비스 배포 및 테스트 진행 상황
-
맞춤법 봇: 띄어쓰기 교정 로직 및 API 테스트
-
일본어 ASR 얼라인 및 ITN 파이프라인 개발 (Day 635)
-
NLP4STT: ITN 평가 메트릭 및 pysommers 의존성 고민
-
RL 모델 서빙 고민
-
CTC Align 실패 현상 및 대안 탐색 (Day 672)
-
PRONAIA 엔진 ITN 파이프라인 오류 (FstOpError)
-
ITN Triton 통합 배포 및 스레드 풀 문제
-
다드미 배포 논의: Align 알고리즘 병목 및 버그 분석
-
3i4k 모델 검증 및 VTS 테스트셋 평가 전략
-
ITN 성능 시험 및 VAD 통합 테스트 진행 (Day 667)
-
Day 665: ITN 모델 배포 장애 및 환경 정리
-
ITN 개발 및 에이전트 아키텍처 논의 (Day 680)
-
프로나이아 패키지화 및 3i4k FP 검증
-
다듬이: 음성 텍스트 전처리 로직 개선
-
업라이즈 AI바우처: 금융 콘텐츠 요약 서비스 및 NLP4STT 기술적 장애물
-
맞춤법 데이터 구조 및 토크나이징 전략 논의
-
Parquet 오디오 데이터 추출 및 전처리 스크립트
-
한중일 한자 발음 매핑 및 데이터베이스 구축 구상
-
Callabo STT 성능 개선 및 일본어 Qoo10 데이터 얼라인 전략
-
다듬이: 단어 정렬 및 매핑 알고리즘 개선
-
다듬이: 텍스트 처리 파이프라인 성능 최적화 및 병렬화 실험
-
다듬이: Turn 기반 처리 파이프라인 재설계 및 Pandas 인덱스 문제
-
오전 업무 스몰토크 (Day 597)
-
GOP 개발 및 기술적 고민 (2022-07-13)
-
Project-K 지역락 이슈 및 모델 이미지 재퍼블리시
-
STT 실시간 엔진 배포 가이드 및 데이터셋 전처리 현황
-
NLP4STT 프로젝트 마무리 및 팀원 이탈 회고
-
ReturnZero Day 532: Kiwi 모델 검증 및 일본어 숫자 태깅 규칙 분석
-
ReturnZero Day 359: Python Client 완료 및 3i4k 데이터 FP 검증 시작
-
2022-06-20 워크샵 및 모델 실험 기록
-
3i4k 모델 성능 저하 분석 및 Pronaia 클라이언트 개발 현황
-
다듬이 마무리 (Day 702)
-
Stock Trader 데이터 준비 및 아키텍처 검토
-
ReturnZero Day 640: 텍스트 처리 파이프라인 리팩토링 및 세그멘테이션 이슈
-
Triton Custom Backend 학습 계획 및 모델 웜업 개념 정리
-
일본어 데이터 정제 및 전처리 파이프라인 (Day 1562)
-
Day 902: Audio Feature Extraction & Model Check
-
가독성 개선
-
단위별 Confidence 및 Entropy 계산 로직 정립
-
일본어 데이터 전처리 및 정제 규칙 (Day 790)
-
다듬이 및 일본어 모델 처리 논의 (Day 642)
-
SetFit 제로샷 분류 실험 및 ReturnZero 현황 (Day 545)
-
맞춤법 검사 자동화 봇 및 데이터 파싱 로직
-
압축 이슈 해결
-
일본어 데이터 전사 비교 및 정규화 로직 수정
-
현택의 블록체인 기반 데이터 거래 모델 고찰
-
Day 497. 2022-11-09
-
Day 901. 2023-12-18
-
Day 588: 띄어쓰기 교정 실험 및 KAIST 채용 심사 기록
-
ReturnZero Day 495: 화자 분리 실패와 룰 기반 FP 감수
-
Day 365: VTS Trial 실험 결과 및 SAC 킥오프
-
2026-01-20 업무: 제로원 TTS 데이터 정제 및 일본어 STT 모델 배포 가이드
-
Day 303: 모델 이미지 재배포 및 TTS 연구 시작
-
ReturnZero Day 1047: 일본어 ASR 모델 검증 및 성능 분석
-
Day 931. 2024-01-18
-
Day 844. 2023-10-23
-
Day 820. 2023-09-28
-
Day 536. 2022-12-18
-
Qoo10 일본어 ASR 파이프라인 및 엔진 성능 테스트 (Day 797)
-
일본어 NLP 데이터 정제 및 운영 라이선스 발급
-
일본어 ASR 파이프라인 구축 및 Forced Alignment 문제 해결 시도
-
Day 14. 2021-07-14
-
ReturnZero E2E 파이프라인 실행 순서 및 데이터 구조 분석
-
ReturnZero Day 482: 비즈니스 통화 스크립트 검토 및 결과 비교 실험
-
ReturnZero Day 1643: 모델 레지스트리 구조화 및 전사 장애 분석
-
Triton 이미지 교체 및 Pronaia Engine 배포 작업
-
Day 1106. 2024-07-11 업무 요약
-
ReturnZero Day 1058: ASR 파이프라인 진행 상황 및 버그 수정
-
기가코리아 개발 회의
-
폰 데이터 이전 및 정리 체크리스트
-
AncomCluster 인프라 구성 및 서비스 배포 가이드
-
T4 빌드 및 일본어 NLP 처리 방안
-
Day 61 (2021-08-30) - ReturnZero 일지
-
Day 589. 2023-02-09
-
일본어 숫자 및 날짜 처리 로직 개선 (Day 533)
-
프로나이아 모델 배포 및 스마트 어터런스 처리 로직 설계
-
리팩토링 시도: cdrewrite 및 transducer 기반 태그 삽입 성능 문제
-
Day 461. 2022-10-04
-
Day 428. 2022-09-01
-
WFST 규칙 최적화 및 성능 평가 (Day 404)
-
gip-decoder 배포 및 TTS 아키텍처 검토
-
Day 212. 2022-01-28
-
2026-04-09 업무: PVI, 일본어 ASR 개선 및 TTS 관리 기능 개발
-
Day 1022 (2024-04-18) - ReturnZero Daily Note
-
Conformer 모델 앙상블 및 BLS 통합 실험 (Day 910)
-
ReturnZero Day 903: 모델 최적화 시도 및 성능 벤치마크
-
ReturnZero Day 860: STT 모델 수정 및 성능 벤치마크
-
ReturnZero Day 832: 일본어 인식 실험 및 Prefix Decoder 평가
-
일본어 TTS 데이터 전처리 및 학습 구성안
-
ReturnZero Day 814: 일본어 모델 학습 속도 문제 및 해결
-
Day 8. 2021-07-08
-
Day 693. 2023-05-24
-
ITN 모델 배포 및 성능 튜닝 (Day 666)
-
rt-dadumi: 타임스탬프 복구 및 세그먼트 처리 로직
-
Day 610: 태스크 정리 (NLP4STT, 다듬이, 일본어 데이터)
-
BERT 모델의 ONNX 변환 및 Triton Server 배포 시도 (Day 559)
-
Day 555: ONNX 모델 배포 및 환경 구성 고민
-
Day 448. 2022-09-21
-
Rule-based NER 및 Semantic Role Labeling 구현 전략
-
WFST 코드 보완 및 분류 모델 성능 평가 (Day 400)
-
Python Client 초기 배포 및 구조 검토 (Day 358)
-
Day 335. 2022-05-31
-
S2 리빌드 문서화 및 다국어 RTFx 측정 환경 구축
-
ReturnZero Day 1622: STT 파이프라인 개선 및 배포 인프라 작업
-
ReturnZero 일본어 배포 및 문서 수정 (Day 1545)
-
Day 1104 (2024-07-09) - ReturnZero Daily Note
-
ReturnZero 데이터셋 전처리 및 pysommers 파이프라인 디버깅
-
Day 1036: 상태 확인 및 기술적 장애물
-
Day 1009: 팀벨 레이턴시 이슈 및 일본어 E2E 세그멘테이션
-
일본어 음성 인식(ASR) 전사 파이프라인 디버깅 및 경량화 시도
-
Day 937: 다드미 버그 수정, 일본어 데이터 수집, 특허 보완
-
PRONAIA BMT 서비스 배포 및 테스트 데이터 준비 현황
-
ReturnZero Day 858: Confidence Score 적용 및 모델 변경
-
Whisper Dadumi 대응 및 언어 정보 처리
-
일본어 이름 모델 검증 및 T4 배포 준비
-
dadumi 버그 수정 및 Pronaia API 구조 분석
-
일본어 ASR 실험 및 Utterance Segmenter 개발 현황
-
ReturnZero Day 686: 큐 병목 및 Worker 성능 저하 대응
-
다듬이 올인: 문장 처리 파이프라인 및 말풍선 병합 로직 설계
-
일본어 ASR 파이프라인 설정 및 실험 기록
-
Qoo10 rtboost 구현 및 dadumi aligner 알고리즘 설계 고민
-
Neural-ITN TensorRT 배포 시도 및 한계
-
Triton Ensemble 구현 및 NLP4STT 띄어쓰기 이슈
-
2023-01-05 일지: pysommers 배포 문제 해결, NLP4STT 띄어쓰기 모델 최적화 및 사업계획
-
일단 합쳤다가 풀기 (Batch Processing & Async Architecture)
-
Apologize FP & Rule-Based Classifier Issues
-
SAC 통화 요약: 추출형 vs 생성형 요약 전략 및 평가 지표
-
ReturnZero 분류 모델 성능 보정 실험 (Day 401)
-
프로젝트 Bled 중단 및 SAC 프로젝트 집중
-
3i4k VTS 데이터 전처리 및 BMT 음성 전사 이슈
-
2026-01-23 업무: 제로원 집중 및 일본어 STT 개선
-
ReturnZero Day 1645: 모델 레지스트리 및 웰컴용 STT 패키징 진행
-
2025-10-14 업무: 일본어 STT 튜닝 실험 및 제로원 제안서 초안
-
Engine 코드 수정 및 검증 (2024-12-27)
-
Day 1043: PII Redaction Filter 개발 및 On-Prem 모델 관리
-
수열 패턴 및 제곱근 근사 공식 탐구 (2019)
-
2024-05-17 일기: Llama 3 양자화 가이드 및 일본어 데이터셋 수집
-
Day 995. 2024-03-22
-
일본어 음성 전사 파이프라인 설계 및 고려사항
-
MWW 한국어 STT 배포 및 SIMS Backend 아키텍처 검토
-
STT 성능 벤치마킹 및 특허 기술 아이디어 정리
-
Day 897: E2E 테스트, 데이터 증강 및 LM 적용 논의
-
Day 875. 2023-11-23
-
Day 847: Triton 테스트 환경 구축 및 특허 전략 논의
-
일본어 ASR 모델 실험 및 데이터 파이프라인 개선 (Day 811)
-
미래에셋 방문 및 일본어 데이터 준비 작업
-
워커 3단 배포 전략 및 차트 개발 현황
-
주소 모델 개발 현황
-
Torch 의존성 제거 및 Triton 이미지 배포 작업 (Day 658)
-
ReturnZero: WFSTClassifier 리팩토링 및 명명 규칙 정리
-
Callabo 회의록 기능의 방향성 재고 및 우선순위 하향 조정
-
Fine-tuning 개념 정리
-
미팅 요약 서베이 및 화행 분석
-
회의록 요약(Action Item 추출) 연구 서베이 및 난점 분석
-
WFST 테스트 코드 및 규칙 개발 (Day 391)
-
WFST 인터페이스 및 파인튜닝 진행 상황 (Day 383)
-
어미 처리 실험
-
Day 323. 2022-05-19
-
삼성 마지막 날: GRPC 서버 개발 및 TTS 요구사항 정의
-
Triton-Kaldi ASR 파이프라인 개선 및 스트레스 테스트 계획
-
ASR 모델 개선 현황: PVI, 일본어, MWW 화물맨
-
2026-04-23 업무: PVI 및 일본어 ASR 개선
-
ReturnZero Day 1749: PVI 및 일본어 ASR 개선 작업
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-02-27)
-
TTS 개선 및 S2 리빌드
-
MWW EKS 배포 장애 및 STT 모델 평가 이슈 (Day 1168)
-
ReturnZero Day 1147: AM 모델 학습 API 테스트
-
Vito STT 성능 벤치마킹 및 환경 설정 기록 (2024-07-01)
-
ReturnZero Day 1061: STT 엔지니어링 및 평가 현황
-
Day 1. 2021-07-01
-
RLLib 얼라인: 학습 코드 검토 및 Google Trends 데이터 검증
-
polyglot-ko 서빙 준비도
-
Vocab 실험 및 작업량 분석
-
VAD 임계값이 이름 학습 모델 성능에 미치는 영향 실험
-
배포 워크플로우 논의 (Day 859)
-
일본어 ASR 데이터 전처리 및 Pronaia 메시지 구조 정의
-
ReturnZero Day 764: 헬름차트 변경 및 배치 처리 아키텍처 논의
-
Triton Server 헬름 차트 배포 및 모델 로딩 오류
-
주소 교정 (Address Correction)
-
Day 699: dadumi 배포 및 일본어 ASR 평가
-
rt-itn-jp 코드 모델 및 WFST 구현 계획
-
ReturnZero Day 582: 워크플로우 연동 및 Triton 배포 계획
-
ReturnZero Day 488: 팀 기조 변경 및 NLP 전략 재정의
-
STT 관련 고찰
-
WFST 최적화 및 결정화 알고리즘 검토
-
Day 390: 핵심성분 분석 및 WFST 테스트 진행
-
Day 369. 2022-07-04
-
2022-05-18 일일 작업 기록: 서베이 및 배포 프로세스 개선 논의
-
Day 301. 2022-04-27
-
GOP 프로젝트: ivector 문제 탐색 및 도커 배포 준비 (Day 299)
-
Day 285. 2022-04-11
-
Day 187. 2022-01-03
-
2026-05-28 업무 및 기술 이슈 요약
-
2026-05-21 업무: PVI 및 일본어 ASR 모델 개선 현황
-
ASR 모델 개선 및 프로젝트 진행 현황 (2026-05-07)
-
S2 리빌드 및 일본어 ASR 모델 개선 현황 (2026-03-13)
-
TTS 개선 및 S2 리빌드
-
ReturnZero Day 1650: 업무 현황 및 제로원 TTS TN 설계 초안
-
ReturnZero Day 1644: 모델 레지스트리 구축 및 웰컴용 STT 패키징
-
2025-10-13 업무: 일본어 STT 모델 검증 및 제로원 제안서 초안
-
일본어 프로젝트 진행 상황
-
일본어 주소 인식 모델 배포 및 MWW STT 성능 검증
-
인프라 구축 현황
-
MWW 일본어 배포 및 가독성 평가 실험 (2024-07-24)
-
전처리 이슈
-
ReturnZero Day 1041: 일본어 STT 데이터 전처리 및 학습 전략
-
OVMS 컨테이너 Segmentation Fault (Exit Code 139)
-
FreqAI 설정 및 커스텀 데이터 활용 가능성 탐구
-
Hypernetwork 구조 분석 및 한계점