X-Class: XML 문서 구조 기반 연관 분류

Source

  • Evernote/Papers/X-Class Associative Classification of XML Documents by Structure.md

Summary

기존 XML 구조 기반 분류 방식은 사전 정의된 하위 구조(substructures)를 사용하므로 문서의 실제 구조적 특성과 불일치할 수 있어 분류 성능이 저하되는 문제가 있다. 본 논문은 이러한 한계를 극복하기 위해 X-Class 접근법을 제안한다. X-Class는 모든 유형의 트리형 하위 구조를 처리할 수 있으며, 주어진 XML 문서 집합에서 가장 판별력(discriminatory)이 높은 구조적 규칙성을 자동으로 선택하여 분류 모델의 정확도를 향상시킨다.

Key Points

  • 기존 방식의 문제점: 사전 정의된 하위 구조 사용으로 인해 XML 문서의 실제 구조적 특성과 불일치하여 분류 효과성이 떨어짐
  • 제안 방법: X-Class 접근법
  • 핵심 기능: 모든 유형의 트리형 하위 구조(tree-like substructures) 처리 가능
  • 주요 기여: 사용 가능한 XML 문서 구조에 가장 잘 적응하는, 가장 판별력 있는 구조적 규칙성 선택