STT 성능 벤치마킹 및 특허 기술 아이디어 정리

Source

  • Field Notes/ReturnZero/Daily Notes/Day 922. 2024-01-09.md

Summary

2024 년 1 월 9 일 일일 노트로, STT(음성인식) 모델의 성능 벤치마킹 결과와 관련 운영/개발 TODO, 그리고 음성 처리 관련 특허 보완 아이디어를 기록하고 있다. 주요 내용은 다음과 같다: 1) 다양한 테스트셋 (가타카나, 영숫자, 숫자, 한자/주소) 에 대한 RTFx, CER, SER 지표 비교 및 ‘padding 개조’ 전후 성능 변화 관찰. 2) k8s 구조도 작성, 헬름 차트 테스트, GPU 노드 편입 등 인프라 운영 매뉴얼 관련 TODO. 3) 발화 시간 정보 기반 문장 분리, 문맥 고려 키워드 표기법, 패턴/블랙리스트 기반 분류, 복합 분류 할당, 인토네이션 기반 분류 등 음성/NLP 처리 알고리즘에 대한 특허 기술 아이디어 초안.

Key Points

  • STT 모델 성능 벤치마킹: 가타카나, 영숫자, 숫자, 한자/주소 등 도메인별 RTFx, CER, SER 지표 측정 및 비교.
  • 성능 최적화 시도: ‘padding 개조’ 적용 전후 성능 변화 관찰 (RTFx 증가, CER/SER 미세 변동).
  • 인프라 운영 TODO: k8s 구조도 작성, 헬름 차트 테스트, GPU 노드 편입 작업.
  • 특허 기술 아이디어: 발화 시간 정보 활용 문장 분리, 문맥 기반 키워드 표기법, 패턴/블랙리스트 조합 분류, 복합 분류 할당, 인토네이션 기반 분류 등.
  • 테스트 환경: grpc-host(pierce.rtzr.ai), concurrent=800 환경에서의 online_bmt.sh 실행 로그 포함.