2025-10-14 업무: 일본어 STT 튜닝 실험 및 제로원 제안서 초안

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1567. 2025-10-14.md

Summary

본 노트는 2025 년 10 월 14 일의 주요 업무 진행 상황을 기록한 일일 노트입니다. 핵심 주제는 세 가지로 나뉩니다. 첫째, 일본어 음성 인식 (STT) 모델의 재학습 및 튜닝 실험으로, 하이픈 및 괄호 처리 오류 (CER 상승) 를 해결하기 위해 다양한 버전 (v3, v4, v6_1, v6_2) 의 테스트 결과와 CER/RTF 지표를 비교 분석하고 있습니다. 둘째, ‘제로원’ 프로젝트 제안서 작성으로, 온디바이스용 경량 신경망 언어 모델을 통한 텍스트 정규화 (TTS 입력 전처리) 개발을 위한 프로젝트 개요, 일정 (4 개월), 예산 (5 천만 원) 및 수행 항목을 초안화하고 있습니다. 셋째, KISA 프로젝트 관련 R&D 서버 사양 확인 및 비즈니스 로직 (STT API 변경) 논의, 그리고 현대카드 Redis 버전 업데이트 이슈를 기록하고 있습니다.

Key Points

  • 일본어 STT 모델 튜닝 실험 진행 중이며, 하이픈/괄호 처리로 인한 CER(CER) 상승 문제가 주요 개선 대상임.
  • 다양한 모델 버전 (v3, v4, v6_1, v6_2) 에 대한 평가 결과 (CER, RTF, ins/del/subs 수) 를 기록하여 성능 비교 중임.
  • 제로원 프로젝트 제안서 초안 작성: ‘음성생성용 텍스트 정규화를 위한 경량 신경망 언어 모델 개발’ 프로젝트.
  • 제로원 프로젝트 세부 사항: 기간 2025.11~2026.02(4 개월), 예산 5 천만 원, 토크나이저 및 증류 (Distillation) 기술 포함.
  • KISA 프로젝트: R&D 서버 사양 (VRAM 24GB 등) 확인 필요, STT Response API 변경 (result, return_type 등) 논의.
  • 인프라 이슈: 현대카드 Redis 버전 업데이트 (7.2.11 vs 8.2.2) 준비 필요.