Similarity-based Clustering by Left-Stochastic Matrix Factorization
Source
Evernote/IFTTT Feedly/Similarity-based Clustering by Left-Stochastic Matrix Factorization.md
Summary
이 논문은 유사도 행렬의 요소를 미지의 클러스터 확률의 내적으로 모델링하는 유사도 기반 클러스터링 방법을 제안합니다. 주어진 유사도 행렬로부터 클러스터 확률을 추정하기 위해 왼쪽 확률적 비음수 행렬 분해(left-stochastic non-negative matrix factorization) 문제를 도입하고, 이를 위한 회전 기반 알고리즘을 제시합니다. 고유한 행렬 분해 및 클러스터링의 조건과 오차 한계를 제공하며, 특히 2개 클러스터 경우에 효율적이어서 다수 클러스터 시 계층적 변형 알고리즘을 제안합니다. 실험 결과, 제안된 모델은 대부분의 데이터셋에서 높은 클러스터 내 유사도를 보이며 주어진 클래스 라벨과 일치하고, 효율적인 계층적 변형도 우수한 성능을 보입니다.
Key Points
- 유사도 행렬 요소를 클러스터 확률의 내적으로 모델링
- 왼쪽 확률적 비음수 행렬 분해(left-stochastic NMF) 문제 도입
- 회전 기반 행렬 분해 알고리즘 제안
- 고유 분해 조건 및 오차 한계 제공
- 2개 클러스터 시 효율적이며, 다수 클러스터 시 계층적 변형 제안
- 실험적으로 높은 클러스터 내 유사도 및 클래스 라벨 일치 성능 확인
Related
-
Nonlinear Latent Factorization by Embedding Multiple User Interests
-
Fast Near-Duplicate Image Detection Using Uniform Randomized Trees
-
Neighborhood Preserving Codes for Assigning Point Labels: Applications to Stochastic Search
-
Smooth Nonnegative Matrix Factorization for Unsupervised Audiovisual Document Structuring
-
λ-Diverse Nearest Neighbors Browsing for Multidimensional Data
-
Point Representation for Local Optimization: Towards Multi-Dimensional Gray Codes
-
Efficient Closed-Form Solution to Generalized Boundary Detection
-
An Unsupervised Feature Selection Framework for Social Media Data
-
Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features
-
A Hamming Embedding Kernel with Informative Bag-of-Visual Words for Video Semantic Indexing
-
Information-Theoretic Outlier Detection for Large-Scale Categorical Data
-
Beyond Text QA: Multimedia Answer Generation by Harvesting Web Information
-
Protecting Sensitive Labels in Social Network Data Anonymization
-
Weakly Supervised Learning of Object Segmentations from Web-Scale Video
-
Social Event Classification via Boosted Multimodal Supervised Latent Dirichlet Allocation
-
Efficient Inference and Structured Learning for Semantic Role Labeling
-
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine (Technical Supplement)
-
Moment-Based Spectral Analysis of Large-Scale Networks Using Local Structural Information
-
Structured Streaming Skeleton (SSS): 온라인 인간 제스처 인식용 새로운 특징 추출 방법
-
Patent Query Formulation by Synthesizing Multiple Sources of Relevance Evidence