An Unsupervised Feature Selection Framework for Social Media Data
Source
Evernote/Inbox/An Unsupervised Feature Selection Framework for Social Media Data.md
Summary
본 논문은 라벨 정보가 없고 차원이 높은 소셜 미디어 데이터에 대한 비지도 특징 선택(Unsupervised Feature Selection) 문제를 다룬다. 소셜 미디어 데이터는 연결성(linked)을 가지므로 기존 알고리즘의 독립 동일 분포(i.i.d.) 가정이 무효화되는 점을 해결하기 위해, 연결된 데이터에서 추출된 관계를 활용하는 새로운 프레임워크인 LUFS(Link-based Unsupervised Feature Selection)를 제안한다. 실제 소셜 미디어 웹사이트 데이터셋을 통한 실험에서 제안된 프레임워크의 유효성과 잠재력을 입증했다.
Key Points
- 소셜 미디어 데이터는 라벨 부재와 고차원성, 그리고 고유한 연결성(linked nature)으로 인해 비지도 특징 선택이 기존보다 더 복잡하다.
- 기존 알고리즘이 전제하는 독립 동일 분포(i.i.d.) 가정이 소셜 미디어 데이터에는 적용되지 않음.
- 연결된 데이터에서 추출된 관계를 활용하여 관련 특징을 선택하는 새로운 비지도 특징 선택 프레임워크 ‘LUFS’ 제안.
- 실제 소셜 미디어 데이터셋을 대상으로 한 실험을 통해 LUFS 프레임워크의 유효성 검증.
Related
-
Protecting Sensitive Labels in Social Network Data Anonymization
-
Supporting Flexible, Efficient, and User-Interpretable Retrieval of Similar Time Series
-
Feature Ensemble Plus Sample Selection: Domain Adaptation for Sentiment Classification
-
λ-Diverse Nearest Neighbors Browsing for Multidimensional Data
-
A Prediction-Based User Selection Framework for Heterogeneous Mobile CrowdSensing
-
Information-Theoretic Outlier Detection for Large-Scale Categorical Data
-
Social Event Classification via Boosted Multimodal Supervised Latent Dirichlet Allocation
-
Moment-Based Spectral Analysis of Large-Scale Networks Using Local Structural Information
-
Unsupervised Spatial Event Detection in Targeted Domains with Applications to Civil Unrest Modeling
-
Efficient Multiview Maintenance under Insertion in Huge Social Networks
-
Similarity-based Clustering by Left-Stochastic Matrix Factorization
-
Active Learning through Adaptive Heterogeneous Ensembling (AHE)
-
Enlisting the Ghost: Modeling Empty Categories for Machine Translation
-
Anomaly Extraction in Backbone Networks Using Association Rules
-
Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features
-
동적 스타 네트워크에서 다중 유형 객체의 공진화 (Co-Evolution of Multi-Typed Objects in Dynamic Star Networks)
-
Structured Streaming Skeleton (SSS): 온라인 인간 제스처 인식용 새로운 특징 추출 방법
-
Neighborhood Preserving Codes for Assigning Point Labels: Applications to Stochastic Search
-
10 surprising social media statistics that might make you rethink your social strategy
-
Smooth Nonnegative Matrix Factorization for Unsupervised Audiovisual Document Structuring