ReturnZero Day 700: 샌박 테스트 결과 및 일본어 STT 프로젝트 현황

Source

  • Field Notes/ReturnZero/Daily Notes/Day 700. 2023-05-31.md

Summary

2023-05-31 일지. 샌박 테스트 결과로 처리 시간이 TDiar 의 2 배임을 확인하고 EPM 기준을 수정함. 일본어 STT 프로젝트는 ‘아직 부족하다’는 피드백을 받았으며, 노이즈 강건성 50% 달성 및 계약 변경 (10 억) 을 논의 중. 한국어 (현대캐피탈) 와 일본어 온프레미스 구축, 추가 학습용 데이터셋 (공적/CS 대화) 확보가 핵심 과제임. 학습 환경 설정 (NFS, memmap) 및 VAD 3.4 적용 실험 계획 수립.

Key Points

  • 샌박 테스트 결과: 처리 시간이 TDiar 의 2 배 수준으로 확인되어 EPM 기준을 이에 맞게 조정
  • 일본어 STT 프로젝트: 현재 성능에 대해 ‘아직 부족하다’는 평가, 노이즈 강건성 50% 목표
  • 비즈니스 현황: 계약 변경 (10 억 규모) 논의, 한국어 (현대캐피탈) 및 일본어 온프레미스 설정 필요
  • 데이터 및 학습: ‘공적 대화’, ‘CS 대화’ 유사 데이터셋 확보 요청, 모바일 데이터 포함
  • 기술 실험: VAD 3.4 적용 후 v3_1 및 v2_final 모델 비교 실험 계획, NFS 환경에서의 학습 효율성 검토