Qoo10 일본어 ASR 파이프라인 및 엔진 성능 테스트 (Day 797)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 797. 2023-09-05.md

Summary

Qoo10 일본어 데이터셋을 활용한 ASR 파이프라인 재구축(데이터셋 생성, 오디오 실행, 병합, 재생성) 과정과 ‘눈물 케이스’로 분류된 특정 발음 오류 사례(kanna_mizuki 언더바 문제)를 기록함. 또한 develop 브랜치에서 분기된 엔진 적용 후 실시간 처리 속도(realtimex ~181x) 및 지연 시간(Latency 평균 ~90ms) 벤치마크 결과를 확인함.

Key Points

  • Qoo10 일본어 데이터 파이프라인: 데이터셋 재작성 → 오디오 실행 → 병합 → 재생성 순서로 진행 (얼라인 재실행 불필요 판단)
  • 오류 사례 분석: ‘kanna_mizuki’ 관련 언더바 처리 오류 및 Qoo10 URL 발음 인식 오류 사례 기록
  • 엔진 성능 벤치마크: develop 브랜치 기반 엔진 적용 후 테스트 결과, 실시간 처리율 약 181배, 평균 지연 시간 약 90ms 수준 확인