URL 쿼리 문자열을 통한 개인정보 유출 측정 연구
Source
Evernote/Inbox/Measuring Privacy Disclosures in URL Query Strings.md
Summary
이 문서는 URL 쿼리 문자열(Query Strings)에 포함된 세션 파라미터 및 폼 데이터가 소셜 네트워크 등 웹 2.0 플랫폼에서 공개적으로 공유될 때 발생하는 개인정보 유출 문제를 다룹니다. 연구진은 8억 9,200만 개의 사용자 제출 URL을 분석한 결과, 170만 개의 이메일 주소는 물론 평문 상태의 사용자명 및 비밀번호까지 발견되었습니다. 연구는 키-드라이븐 및 값-드라이븐 분석을 통해 데이터 누출을 식별하고, 민감한 URL의 클릭률 및 지리적/모바일 행동 패턴을 분석했습니다. 마지막으로 개인정보 침해 내용을 제거하는 ‘CleanURL’ 서비스를 제안합니다.
Key Points
- URL 쿼리 문자열은 세션 파라미터 전달에 필요하지만, 추적 메커니즘, 사용자명, 이메일 등 민감한 정보를 포함할 수 있음
- 웹 2.0 플랫폼에서의 URL 공유 증가로 인해 이러한 정보가 공개적으로 브로드캐스트되는 문제가 대두됨
- 8억 9,200만 개 URL 분석 결과 170만 개 이메일 주소 및 평문 비밀번호 등 심각한 개인정보 유출 사례 확인
- 수동 검사 및 자동 탐지 로직을 활용한 키/값 기반 데이터 누출 식별 방법론 제시
- 민감한 URL의 클릭률, 지리적/모바일 행동 패턴 분석 및 통계적 특성 측정 수행
- 개인정보 침해 내용을 제거(Scrub)하는 CleanURL 서비스 제안
Related
-
웹 페이지의 시각적 복잡성 측정 (Measuring the Visual Complexities of Web Pages)
-
Measuring improvement in user search performance resulting from optimal search tips
-
A Pure Visual Approach for Automatically Extracting and Aligning Structured Web Data
-
모바일 검색 광고의 추가 클릭 영향 (Incremental Clicks Impact of Mobile Search Advertising)
-
브라우저 기반 사후 멀웨어 보호 (Browser Based Retroactive Malware Protection)
-
브라우저 캐시를 통한 지리적 추론 공격 (Geo-Inference Attacks via Browser Cache)