2026-01-23 업무: 제로원 집중 및 일본어 STT 개선

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1668. 2026-01-23.md

Summary

본 노트는 2026 년 1 월 23 일의 업무 기록으로, ‘제로원’ 프로젝트의 프롬프트 관리 및 배치 처리 최적화에 집중해야 한다는 문제의식을 담고 있다. 또한 일본어 STT 모델 개선 (주소, 번호, 가타카나) 을 위한 구체적인 기술적 결정 (데스 전사 후 ITN 제거, 필러 처리 등) 과 한국어 짧은 발화/잡담 혼입 음성 데이터셋 생성 방안 (dominant segment 기반 augmentation) 을 기록하고 있다.

Key Points

  • 제로원 프로젝트: 프롬프트 관리의 중요성 재인식 및 배치 처리를 통한 성능 개선 시도
  • 일본어 STT 개선: 주소/번호 모델 개선 및 가타카나 전사 모델 개발 계획
  • 오류 처리 정책 변경: ‘데스 (death)’ 음성을 기존 무시에서 ‘전사 후 ITN 에서 제거’ 방식으로 변경
  • 데이터셋 생성: 한국어 짧은 발화 및 잡담 혼입 음성을 위한 augmentation 전략 (dominant segment 중심, verbal noise 삽입)
  • 일정 관리: 제로원 대비 및 일본어 킥오프/배포 체크리스트 관리