2026-01-15 업무 및 일본어 ASR 개선 계획

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1660. 2026-01-15.md

Summary

본 노트는 2026 년 1 월 15 일의 업무 진행 상황과 일본어 음성 인식 (ASR) 모델의 주요 개선 과제를 기록하고 있다. 핵심 의제는 일본어 전사 품질 향상을 위한 ‘데스 (filler)’ 처리 방식 변경 (전사 후 ITN 에서 삭제), 주소 및 번호 모델 개선, 그리고 가타카나 모델의 짧은 발화 대응이다. 또한 ‘제로원’ 프로젝트의 코드 리뷰 및 데이터 정제, 두나무 인스턴스 업데이트 등 운영 업무의 진행 상황을 정리하고 있다.

Key Points

  • 일본어 ASR 개선: ‘데스’와 같은 필러는 기존 무시 방식에서 전사 후 ITN 단계에서 삭제하는 방식으로 변경 결정.
  • 일본어 모델 이슈: 주소 (번짓수 등), 번호 (0, 4 처리), 이름 (성/이름 구분, 외국인명) 인식 오류 개선 필요.
  • 가타카나 모델: 짧은 발화 인식 문제 해결을 위해 학습 데이터 (jpn_train) 재검토 및 언어모델 폐기 검토.
  • 프로젝트 진행: ‘제로원’ 프로젝트의 코드 리뷰 및 matt 데이터 정제 코드 작업 진행 중.
  • 운영 업무: 두나무 인스턴스 업데이트 완료 (협업 요청 시까지 유지), worker dynamic narg 변경 리뷰 대기.