2026-01-22 업무 및 모델 개선 이슈

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1667. 2026-01-22.md

Summary

이 날의 핵심 업무는 ‘제로원’ 프로젝트에 대한 집중과 프롬프트 관리이며, 병행하여 한국어 짧은 발화/노이즈 처리 및 일본어 주소/번호/가타카나 모델 개선 과제를 논의했다. 특히 일본어 데스(Death) 전사 전략 변경과 한국어 NF(Non-Final) 문제 해결을 위한 데이터 증강 방안을 구체화했다.

Key Points

  • 주요 목표: 제로원 프로젝트 집중 및 프롬프트 관리 강화
  • 일본어 모델 개선: 주소/번호 모델 개선, 가타카나 전사 모델 개발, 데스 전사 후 ITN 제거 전략 채택
  • 한국어 모델 이슈: 짧은 발화(TDNN 2stage) 및 노이즈(NF) 문제 해결을 위한 데이터 증강 방안(세그먼트 조합) 논의
  • 운영/기타: 두나무 인스턴스 업데이트 유지, worker dynamic narg 변경 리뷰 대기, utterance_save 파이프라인 저장 기능 검토