Logical Itemset Mining (LISM)
Source
Evernote/IFTTT Feedly/Logical Itemset Mining.md
Summary
이 문서는 Google 연구진의 논문을 소개하며, 기존 빈번 항목 집합 마이닝(FISM)의 한계를 지적하고 ‘Logical Itemset Mining(LISM)’ 프레임워크를 제안합니다. FISM은 시장 바구니 데이터에서 노이즈가 많은 빈번 항목만 찾지만, LISM은 각 바구니가 여러 고객 의도(mixture)의 일부(projection)로 구성된 잠재적 혼합물이라고 가정합니다. 이를 통해 노이즈에 강건하며, 소매 도메인의 잠재적 고객 의도나 텍스트 태그의 의미론적 개념과 같은 고품질의 ‘논리적 항목 집합’을 발견할 수 있습니다.
Key Points
- 기존 FISM은 단일 의도만 가정하여 노이즈가 많은 결과를 생성하는 반면, LISM은 ‘혼합(mixture)‘과 ‘투영(projection)’ 속성을 고려합니다.
- LISM은 각 시장 바구니를 잠재적 고객 의도(latent customer intents)의 혼합 및 투영으로 모델링합니다.
- 소매 데이터의 고객 의도나 텍스트 태그의 의미론적 개념 등 다양한 bag-of-items 데이터에 적용 가능합니다.
- 대규모 데이터셋 실험 결과, LISM은 FISM보다 노이즈에 강건하며 규모 확장성이 뛰어나고, 소수이지만 고품질의 논리적 항목 집합을 발견합니다.
Related
-
Nonlinear Latent Factorization by Embedding Multiple User Interests
-
Regularized Latent Semantic Indexing (RLSI): 대규모 토픽 모델링을 위한 새로운 접근법
-
An Unsupervised Feature Selection Framework for Social Media Data
-
Smooth Nonnegative Matrix Factorization for Unsupervised Audiovisual Document Structuring
-
A Hamming Embedding Kernel with Informative Bag-of-Visual Words for Video Semantic Indexing
-
Similarity-based Clustering by Left-Stochastic Matrix Factorization