HEADY: 이벤트 패턴 클러스터링을 통한 뉴스 헤드라인 추상화
Source
Evernote/Inbox/HEADY News headline abstraction through event pattern clustering.md
Summary
구글 연구팀이 제안한 HEADY는 뉴스 컬렉션에서 문법적 패턴을 마이닝하고 Noisy-OR 모델로 일반화하여 헤드라인을 생성하는 추상화(abstractive) 방식입니다. 기존 최첨단 방법 대비 성능을 개선했으며, ROUGE 점수 기준 인간이 작성한 헤드라인과 유사한 수준을 보입니다.
Key Points
- HEADY는 웹 규모 영어 뉴스 코퍼스에서 문법적 패턴을 추출하여 이벤트 설명으로 일반화합니다.
- 추론 시未见 뉴스 컬렉션의 패턴을 쿼리하여 핵심 이벤트를 식별하고 적절한 패턴으로 헤드라인을 생성합니다.
- 기존 open-domain title abstraction 방법보다 성능이 우수하며, 인간 생성 헤드라인과 비교했을 때 ROUGE 점수에서 유사한 성능을 보입니다.
- 추상화 방식의 한계를 줄여 추출(extractive) 방식과의 격차를 절반으로 줄였습니다.
Related
-
Supporting Flexible, Efficient, and User-Interpretable Retrieval of Similar Time Series
-
Information-Theoretic Outlier Detection for Large-Scale Categorical Data
-
Dynamic Time Warping for Music Conducting Gestures Evaluation
-
Regularized Latent Semantic Indexing (RLSI): 대규모 토픽 모델링을 위한 새로운 접근법
-
A term-based inverted index partitioning model for efficient distributed query processing
-
Patent Query Formulation by Synthesizing Multiple Sources of Relevance Evidence
-
Structured Streaming Skeleton (SSS): 온라인 인간 제스처 인식용 새로운 특징 추출 방법