트위터 다면적 토픽 모델링을 위한 사회적 및 보조 의미 통합
Source
Evernote/Inbox/Integrating Social and Auxiliary Semantics for Multifaceted Topic Modeling in Twitter.md
Summary
본 문서는 트위터와 같은 마이크로블로깅 플랫폼에서 잠재 토픽을 발견하기 위한 연구 논문을 소개합니다. 기존의 Bag-of-Words 기반 토픽 모델은 트위터의 풍부한 의미와 시간적 측면을 포착하는 데 한계가 있습니다. 특히 트위터 콘텐츠는 연결된 웹 문서(보조 의미)나 특정 엔티티(사람, 조직)에 의해 영향을 받습니다. 이 논문은 이러한 외부 정보원을 활용하여 마이크로블로그의 의미를 더 잘 이해하고 다면적 토픽 모델링을 수행하는 방법을 제시합니다.
Key Points
- 기존 Bag-of-Words 가정 기반 토픽 모델은 트위터의 복잡한 의미와 시간적 맥락을 충분히 반영하지 못함
- 트위터 콘텐츠는 연결된 웹 문서(보조 의미, Auxiliary Semantics) 및 특정 엔티티(사람, 조직)에 의해 크게 영향받음
- 외부 정보원(보조 의미)을 통합하여 마이크로블로그의 의미를 보완하고 다면적 토픽 모델링의 정확도를 향상시킴
- 클러스터링, 분류, 추천 등 하위 애플리케이션을 위한 잠재 토픽 발견의 중요성 강조
Related
-
Regularized Latent Semantic Indexing (RLSI): 대규모 토픽 모델링을 위한 새로운 접근법
-
Unsupervised Spatial Event Detection in Targeted Domains with Applications to Civil Unrest Modeling
-
사회적·공간적 근접성을 활용한 공동 검색 (Joint Search by Social and Spatial Proximity)
-
Social Event Classification via Boosted Multimodal Supervised Latent Dirichlet Allocation
-
웹캠의 지리적 통합 및 보정 (Web-accessible geographic integration and calibration of webcams)
-
Semantic content-based recommendation of software services using context