utterance_save 암호화 구현 및 sims-trainer 구조 개선

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1482. 2025-07-21.md

Summary

현대캐피탈 고도화 프로젝트의 일환으로 음성 데이터(utterance) 저장 시 암호화(.wav.enc)를 구현하는 작업 진행 상황과 기술적 고민을 기록함. pronaia-engine, sims cronjob, admin export 기능에 대한 암호화 로직 적용 완료 및 K8s Secret 기반 passphrase 관리 방안을 제시함. 또한 train job의 데이터 복사 및 복호화 구조를 init container로 개선하려는 시도 중 복잡성(데이터셋 경로, fairseq 설정 등)으로 인해 난관에 부딪혔음을 명시함. 테스트 절차와 sims-trainer 리뷰 계획도 포함됨.

Key Points

  • 현대캐피탈 고도화: USB 준비 및 CycloneDX 관련 사항 언급
  • utterance_save 암호화 구현 현황: pronaia-engine(.wav.enc 생성), sims cronjob(rawRecordData encrypted 필드 신설 및 복호화), sims admin export(암호화 데이터 참조 및 처리) 완료
  • 미완료 사항: sims admin 청취 기능(eval 검증, 미리듣기 등)
  • train job 구조 개선 시도: init container에서 데이터 복사/복호화 수행하여 rt-atp 의존성 제거 시도 중
  • 기술적 난관: 데이터셋 복사 로직(aug data, fairseq 설정 등)의 복잡성으로 인해 구현이 예상보다 어려움
  • 보안 설정: kubectl secret generic을 통한 passphrase 관리 및 환경변수 주입 방안 제시
  • 테스트 계획: 이미지 빌드, secret 추가, 배포, 전사 테스트 순서로 진행 예정
  • sims-trainer 코드 리뷰 계획