A term-based inverted index partitioning model for efficient distributed query processing

Source

  • Evernote/IFTTT Feedly/A term-based inverted index partitioning model for efficient distributed query processing.md

Summary

공유 없는(shared-nothing) 분산 텍스트 검색 시스템에서, Term-based 인덱스 파티셔닝 전략은 인덱스 서버 간 대량의 데이터 전송으로 인한 높은 통신 오버헤드 때문에 확장성 병목 현상을 유발한다. 본 논문은 이러한 문제를 완화하기 위해 하이퍼그래프 파티셔닝(Hypergraph Partitioning)을 기반으로 한 새로운 인버티드 인덱스 파티셔닝 모델을 제안한다.

Key Points

  • 분산 검색 시스템에서 Term-based 인덱스 파티셔닝은 통신 오버헤드로 인해 확장성 저하의 주요 원인이 됨
  • 통신 오버헤드 문제를 해결하기 위해 하이퍼그래프 파티셔닝 기반의 새로운 인덱스 파티셔닝 모델 제안
  • 논문 출처: ACM Transactions on the Web (TWEB), 2013