현대캐피탈 고도화 및 utterance 암호화 구현 진행 상황

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1483. 2025-07-22.md

Summary

본 노트는 2025-07-22 기준 ‘현대캐피탈 고도화’ 프로젝트의 차량명 인식 개선 방안(키워드 추출, 파이프라인 분리, WFST 모델 검토)과 ‘utterance_save’ 기능의 암호화 구현 진행 상황을 기록한 일일 업무 메모이다. 암호화 구현은 pronaia-engine, sims cronjob, admin export/청취, train job 구조 개선까지 완료되었으나, eval job은 미완료 상태이다. 특히 K8s 환경에서의 데이터 복사 및 복호화 로직(init container 활용)과 테스트 절차의 복잡성으로 인해 구현 난이도가 높음을 지적하고 있다.

Key Points

  • 차량명 인식: 키워드 추출(1000/100개 제한), 파이프라인 분리, prefix/WFST 모델 추천, 후처리 replacer 도입 논의
  • utterance 암호화: pronaia-engine(.wav.enc 생성), sims cronjob(rawRecordData encrypted 필드 신설), admin export/청취 기능 연동 완료
  • Train Job 구조 개선: init container에서 데이터 복사 및 복호화 수행, rt-atp 의존성 제거 시도 중
  • 미완료 사항: eval job 구현 미완료, K8s secret 관리 및 RTZR_SKIP_DATA_COPY 전달 방식 등 테스트 환경 구축의 복잡성 고지