Algebraic Optimization for Processing Graph Pattern Queries in the Cloud

Source

  • Evernote/Papers/Algebraic Optimization for Processing Graph Pattern Queries in the Cloud.md

Summary

대규모 데이터 처리 표준인 MapReduce(Hadoop)는 시맨틱 웹 처리에서 일반적인 조인 집약적 워크로드에 한계가 있다. 본 문서는 Nested TripleGroup Data Model 및 대수(NTGA) 기반의 대수적 최적화 접근법을 소개하며, 이는 MapReduce 사이클 수를 줄여 전체 처리 비용을 최소화한다. 또한 Apache Pig에 NTGA 기반 그래프 패턴 쿼리 처리를 통합하는 방법과 관계형 스타일 대수 연산자를 사용한 실행 계획과의 비교를 제시한다.

Key Points

  • MapReduce 플랫폼은 시맨틱 웹의 조인 집약적 워크로드 처리에 한계가 있음.
  • Nested TripleGroup Data Model 및 대수(NTGA)를 활용한 대수적 최적화 제안.
  • MapReduce 사이클 감소를 통한 전체 처리 비용 최소화.
  • Apache Pig와의 통합 및 관계형 대수 연산자 기반 실행 계획과의 비교 분석.