계층 구조(Taxonomy) 존재 하의 시간적 변화 패턴 발견 (HiGen)
Source
Evernote/Papers/Discovering Temporal Change Patterns in the Presence of Taxonomies.md
Summary
이 논문은 시장 환경 변화에 따라 데이터 마이닝에서 중요한 상관관계 변화를 탐지하는 ‘변화 마이닝(Change Mining)’ 문제를 다룹니다. 특히, 계층 구조(Taxonomy)가 있는 데이터에서 특정 아이템셋이 특정 시점부터 빈도가 낮아져 더 이상 추출되지 않을 때, 이를 상위 개념으로 일반화하여 추적을 계속하는 새로운 동적 패턴인 **HiGen(History Generalized Pattern)**을 제안합니다. HiGen은 최소한의 중복성(최소 추상화 수준)을 가진 빈번한 일반화 정보를 보고하여 아이템셋의 진화를 표현합니다. 이를 위해 사후 처리(postprocessing) 없이 지원도 기반의 일반화 접근법을 활용하는 HiGen Miner 알고리즘을 제안하며, 생성되는 패턴 양을 줄이기 위해 Non-redundant HiGens라는 스마트 서브셋 발견도 다룹니다. 실험 결과, 제안된 접근법의 효율성과 실제 적용 유용성이 입증되었습니다.
Key Points
- 변화 마이닝(Change Mining): 시간 경과에 따른 빈번한 아이템셋의 유의미한 변화 탐지.
- HiGen (History Generalized Pattern): 특정 시점부터 희귀해져 추출되지 않는 아이템셋을, 최소 중복성을 가진 상위 일반화 개념으로 추적하여 진화 과정을 표현하는 패턴.
- HiGen Miner: 사후 처리 없이 지원도 기반의 일반화 접근법을 통해 HiGen을 효율적으로 마이닝하는 알고리즘.
- Non-redundant HiGens: 생성되는 패턴의 양을 줄이기 위해 최소한의 중복성을 가진 HiGen의 핵심 서브셋을 발견하는 기법.
- 실험 결과: 실제 및 합성 데이터셋에서 알고리즘의 효율성, 효과성 및 실제 적용 가능성 확인.
Related
-
Supporting Flexible, Efficient, and User-Interpretable Retrieval of Similar Time Series
-
λ-Diverse Nearest Neighbors Browsing for Multidimensional Data
-
Dynamic Time Warping for Music Conducting Gestures Evaluation
-
이동성 모델 분류 체계 및 조사 (A Taxonomy and Survey of Microscopic Mobility Models)
-
Structured Streaming Skeleton (SSS): 온라인 인간 제스처 인식용 새로운 특징 추출 방법
-
Regularized Latent Semantic Indexing (RLSI): 대규모 토픽 모델링을 위한 새로운 접근법
-
A term-based inverted index partitioning model for efficient distributed query processing
-
Unsupervised Spatial Event Detection in Targeted Domains with Applications to Civil Unrest Modeling