Logical Itemset Mining (LISM)

Source

  • Evernote/IFTTT Feedly/Logical Itemset Mining.md

Summary

이 문서는 Google 연구진의 논문을 소개하며, 기존 빈번 항목 집합 마이닝(FISM)의 한계를 지적하고 ‘Logical Itemset Mining(LISM)’ 프레임워크를 제안합니다. FISM은 시장 바구니 데이터에서 노이즈가 많은 빈번 항목만 찾지만, LISM은 각 바구니가 여러 고객 의도(mixture)의 일부(projection)로 구성된 잠재적 혼합물이라고 가정합니다. 이를 통해 노이즈에 강건하며, 소매 도메인의 잠재적 고객 의도나 텍스트 태그의 의미론적 개념과 같은 고품질의 ‘논리적 항목 집합’을 발견할 수 있습니다.

Key Points

  • 기존 FISM은 단일 의도만 가정하여 노이즈가 많은 결과를 생성하는 반면, LISM은 ‘혼합(mixture)‘과 ‘투영(projection)’ 속성을 고려합니다.
  • LISM은 각 시장 바구니를 잠재적 고객 의도(latent customer intents)의 혼합 및 투영으로 모델링합니다.
  • 소매 데이터의 고객 의도나 텍스트 태그의 의미론적 개념 등 다양한 bag-of-items 데이터에 적용 가능합니다.
  • 대규모 데이터셋 실험 결과, LISM은 FISM보다 노이즈에 강건하며 규모 확장성이 뛰어나고, 소수이지만 고품질의 논리적 항목 집합을 발견합니다.