ASR 전사 결과 평가용 프롬프트 영문화 및 간소화

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1090. 2024-06-25.md

Summary

ASR(자동음성인식) 전사 결과의 정확성과 가독성을 평가하는 LLM 프롬프트를 한국어에서 영어로 번역하고, 평가 기준을 단순화하여 정제했다. 주요 작업은 불필요한 지시사항 제거, 평가 항목의 명확화(Accuracy, Readability), 그리고 JSON 출력 형식 표준화였다. 또한 향후 일본어 데이터셋 적용 가능성을 고려하고 있다.

Key Points

  • ASR 전사 결과 평가용 프롬프트를 영문화하여 모델의 이해도를 높임
  • 평가 기준을 ‘정확성(Accuracy)‘과 ‘가독성(Readability)’ 두 가지 핵심 항목으로 간소화
  • 출력 형식을 JSON 구조로 표준화하여 파싱 용이성 확보
  • 기존 한국어 프롬프트의 중복된 지시사항 제거 및 평가 로직 명확화
  • 향후 일본어 ASR 평가로 확장할 계획