HEADY: 이벤트 패턴 클러스터링을 통한 뉴스 헤드라인 추상화

Source

  • Evernote/Inbox/HEADY News headline abstraction through event pattern clustering.md

Summary

구글 연구팀이 제안한 HEADY는 뉴스 컬렉션에서 문법적 패턴을 마이닝하고 Noisy-OR 모델로 일반화하여 헤드라인을 생성하는 추상화(abstractive) 방식입니다. 기존 최첨단 방법 대비 성능을 개선했으며, ROUGE 점수 기준 인간이 작성한 헤드라인과 유사한 수준을 보입니다.

Key Points

  • HEADY는 웹 규모 영어 뉴스 코퍼스에서 문법적 패턴을 추출하여 이벤트 설명으로 일반화합니다.
  • 추론 시未见 뉴스 컬렉션의 패턴을 쿼리하여 핵심 이벤트를 식별하고 적절한 패턴으로 헤드라인을 생성합니다.
  • 기존 open-domain title abstraction 방법보다 성능이 우수하며, 인간 생성 헤드라인과 비교했을 때 ROUGE 점수에서 유사한 성능을 보입니다.
  • 추상화 방식의 한계를 줄여 추출(extractive) 방식과의 격차를 절반으로 줄였습니다.