현대캐피탈 고도화 및 utterance 암호화 구현 현황

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1478. 2025-07-17.md

Summary

현대캐피탈 프로젝트의 차량명 인식 고도화 방안(키워드 추출, WFST 모델 검토)과 utterance 데이터 암호화 구현 진행 상황을 기록한 일일 업무 노트입니다. 차량명 인식은 키워드 파싱 및 boosting 제한, WFST 모델 도입 가능성을 논의했으며, 암호화 구현은 pronaia-engine, sims cronjob/admin에서의 .wav.enc 처리 및 복호화 로직 구현이 대부분 완료된 상태입니다. 향후 train/eval job 구조 개선 및 청취 기능 구현이 남아있습니다.

Key Points

  • 차량명 인식: 키워드 추출 및 boosting 제한(1000/100개), prefix/WFST 모델 비교 검토, 후처리 replacer 적용 논의
  • Utterance 암호화: pronaia-engine(.wav.enc 생성), sims cronjob/admin(복호화, export 로직) 구현 완료
  • 미완료 사항: sims admin 청취 기능, train/eval job 구조 개선(init container 활용 등)
  • 배포 준비: artifacts(license, gpu driver, docker registry, models) 및 chart 수정 작업 진행 중