규칙 기반 엔티티 해결 (Rule-Based Entity Resolution)

Source

  • Evernote/Inbox/Rule-Based Method for Entity Resolution.md

Summary

전통적인 엔티티 해결(ER) 방식은 레코드 간 쌍별 유사도 비교에 의존하지만, 이는 실제 세계의 복잡한 매칭 조건에서 한계가 있다. 본 논문은 레코드와 엔티티 간의 복잡한 매칭 조건을 기술할 수 있는 새로운 규칙 클래스를 제안하고, 이를 기반으로 한 온라인 ER 접근법 및 효율적인 규칙 발견 알고리즘을 제시한다. 실제 데이터셋에 대한 실험 결과, 제안된 규칙 발견 알고리즘과 규칙 기반 ER 알고리즘 모두 높은 성능을 달성함을 보였다.

Key Points

  • 전통적 ER 방식의 한계: 레코드 간 쌍별 유사도 비교는 동일한 엔티티를 참조하는 레코드가 서로 더 유사하다는 가정이 항상 성립하지 않음.
  • 제안 방법: 레코드와 엔티티 간의 복잡한 매칭 조건을 기술하는 새로운 규칙 클래스 기반의 온라인 ER 프레임워크.
  • 규칙 발견: 제안된 규칙 클래스를 기반으로 한 효율적이고 효과적인 규칙 발견 알고리즘 개발.
  • 실험 결과: 실제 데이터셋에서 제안된 규칙 발견 알고리즘 및 규칙 기반 ER 알고리즘의 높은 성능 입증.