URL 쿼리 문자열을 통한 개인정보 유출 측정 연구

Source

  • Evernote/Inbox/Measuring Privacy Disclosures in URL Query Strings.md

Summary

이 문서는 URL 쿼리 문자열(Query Strings)에 포함된 세션 파라미터 및 폼 데이터가 소셜 네트워크 등 웹 2.0 플랫폼에서 공개적으로 공유될 때 발생하는 개인정보 유출 문제를 다룹니다. 연구진은 8억 9,200만 개의 사용자 제출 URL을 분석한 결과, 170만 개의 이메일 주소는 물론 평문 상태의 사용자명 및 비밀번호까지 발견되었습니다. 연구는 키-드라이븐 및 값-드라이븐 분석을 통해 데이터 누출을 식별하고, 민감한 URL의 클릭률 및 지리적/모바일 행동 패턴을 분석했습니다. 마지막으로 개인정보 침해 내용을 제거하는 ‘CleanURL’ 서비스를 제안합니다.

Key Points

  • URL 쿼리 문자열은 세션 파라미터 전달에 필요하지만, 추적 메커니즘, 사용자명, 이메일 등 민감한 정보를 포함할 수 있음
  • 웹 2.0 플랫폼에서의 URL 공유 증가로 인해 이러한 정보가 공개적으로 브로드캐스트되는 문제가 대두됨
  • 8억 9,200만 개 URL 분석 결과 170만 개 이메일 주소 및 평문 비밀번호 등 심각한 개인정보 유출 사례 확인
  • 수동 검사 및 자동 탐지 로직을 활용한 키/값 기반 데이터 누출 식별 방법론 제시
  • 민감한 URL의 클릭률, 지리적/모바일 행동 패턴 분석 및 통계적 특성 측정 수행
  • 개인정보 침해 내용을 제거(Scrub)하는 CleanURL 서비스 제안