두나무 개인정보처리시스템 요건 및 녹취 데이터 마이그레이션 논의

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1357. 2025-03-18.md

Summary

두나무 프로젝트의 개인정보처리시스템 요건 정의 및 3 년치 녹취 데이터 마이그레이션과 STT 전사 작업을 위한 기술적 협의 내용. 주요 쟁점으로 Call ID 와 파일명 매핑, S3/EFS 간 데이터 흐름, 그리고 과거 데이터의 재처리 한계 (Rx/Tx 구분 부재) 가 확인됨.

Key Points

  • 두나무 개인정보처리시스템 요건 회의 참석 및 엑셀 파일 작성
  • 정보보호정책팀의 EFS 아키텍처 관련 질의 대응 (별다른 이슈 없음)
  • 3 년치 녹취 데이터 마이그레이션 및 STT 전사 작업 협의
  • 과거 데이터는 Rx/Tx 구분 부재로 인해 재처리가 불가능함
  • Call ID(record_id) 와 파일명 매핑 방식, S3 Bucket 활용 방안 논의
  • 일시적 인스턴스 확충 (20 대) 을 통한 대량 전사 계획
  • 다음 주까지 3 년치 음성데이터 제공 예정 (DB 는 7 년치 보유)
  • 파일명 - 키 매핑 메타데이터 관리 및 3~7 년 데이터 검증 로직 필요성 검토