An Unsupervised Feature Selection Framework for Social Media Data

Source

  • Evernote/Inbox/An Unsupervised Feature Selection Framework for Social Media Data.md

Summary

본 논문은 라벨 정보가 없고 차원이 높은 소셜 미디어 데이터에 대한 비지도 특징 선택(Unsupervised Feature Selection) 문제를 다룬다. 소셜 미디어 데이터는 연결성(linked)을 가지므로 기존 알고리즘의 독립 동일 분포(i.i.d.) 가정이 무효화되는 점을 해결하기 위해, 연결된 데이터에서 추출된 관계를 활용하는 새로운 프레임워크인 LUFS(Link-based Unsupervised Feature Selection)를 제안한다. 실제 소셜 미디어 웹사이트 데이터셋을 통한 실험에서 제안된 프레임워크의 유효성과 잠재력을 입증했다.

Key Points

  • 소셜 미디어 데이터는 라벨 부재와 고차원성, 그리고 고유한 연결성(linked nature)으로 인해 비지도 특징 선택이 기존보다 더 복잡하다.
  • 기존 알고리즘이 전제하는 독립 동일 분포(i.i.d.) 가정이 소셜 미디어 데이터에는 적용되지 않음.
  • 연결된 데이터에서 추출된 관계를 활용하여 관련 특징을 선택하는 새로운 비지도 특징 선택 프레임워크 ‘LUFS’ 제안.
  • 실제 소셜 미디어 데이터셋을 대상으로 한 실험을 통해 LUFS 프레임워크의 유효성 검증.