웹 데이터베이스 검색 결과 자동 주석 처리 (Automatic Annotation of Web Database Search Results)

Source

  • Evernote/Papers/Annotating Search Results from Web Databases.md

Summary

이 논문은 HTML 폼 기반 인터페이스를 통해 접근 가능한 웹 데이터베이스의 검색 결과 페이지에서 데이터 단위를 자동으로 추출하고 의미 있는 라벨을 부여하는 방법을 제시합니다. 동일한 의미를 가진 데이터를 그룹화한 후, 다양한 관점에서 주석 처리하여 최종 라벨을 예측하는 자동 주석 접근 방식을 제안하며, 이를 통해 해당 웹 데이터베이스의 새로운 결과 페이지를 주석 처리할 수 있는 래퍼(wrapper)를 자동으로 생성합니다.

Key Points

  • 웹 데이터베이스 검색 결과 페이지의 동적 인코딩된 데이터를 기계가 처리할 수 있도록 추출 및 라벨링 필요성 제시
  • 동일한 의미(semantics)를 가진 데이터 단위를 그룹화하는 정렬(align) 과정 수행
  • 각 그룹에 대해 다각적인 주석 처리를 수행하고 이를 집계하여 최종 주석 라벨 예측
  • 특정 검색 사이트에 대한 자동 주석 래퍼 생성을 통해 동일 데이터베이스의 신규 결과 페이지 처리 가능
  • 실험 결과 제안된 접근 방식의 높은 효과성 입증