Incremental Text Indexing for Fast Disk-Based Search
Source
Evernote/IFTTT Feedly/Incremental Text Indexing for Fast Disk-Based Search.md
Summary
Giorgos Margaritis 외는 실시간 검색을 위한 디스크 기반 증분 텍스트 인덱싱 기법을 제안한다. 기존 메모리 기반 방식의 한계를 넘어, 디스크 저장소에서 낮은 지연 시간으로 빠른 검색을 지원하기 위해 ‘Selective Range Flush (SRF)‘라는 탐욕적 알고리즘을 도입하여 인덱스를 디스크 블록에 연속적으로 구성하고 동적으로 업데이트한다.
Key Points
- 실시간 검색 환경에서 증분 콘텐츠 업데이트와 저지연 검색 서비스의 필요성 강조
- 기존 디스크 기반 증분 인덱싱 방식이 인덱스 분산으로 인해 검색 지연 시간을 증가시키는 문제 지적
- 디스크 블록에 인덱스를 연속적으로 조직화하고 저비용으로 동적 업데이트를 수행하는 ‘Selective Range Flush (SRF)’ 알고리즘 제안
- 현대 아키텍처 특성을 고려한 디스크 기반 저장소에서의 고속 검색 지원 목표
Related
-
Regularized Latent Semantic Indexing (RLSI): 대규모 토픽 모델링을 위한 새로운 접근법
-
A term-based inverted index partitioning model for efficient distributed query processing
-
Fast Near-Duplicate Image Detection Using Uniform Randomized Trees
-
Generalized Optimal Response Time Retrieval of Replicated Data from Storage Arrays
-
Efficient Inference and Structured Learning for Semantic Role Labeling
-
Read-Performance Optimization for Deduplication-Based Storage Systems in the Cloud
-
A Hamming Embedding Kernel with Informative Bag-of-Visual Words for Video Semantic Indexing
-
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine (Technical Supplement)
-
Point Representation for Local Optimization: Towards Multi-Dimensional Gray Codes
-
Efficient Closed-Form Solution to Generalized Boundary Detection
-
Neighborhood Preserving Codes for Assigning Point Labels: Applications to Stochastic Search
-
Similarity-based Clustering by Left-Stochastic Matrix Factorization
-
Supporting Flexible, Efficient, and User-Interpretable Retrieval of Similar Time Series
-
Smooth Nonnegative Matrix Factorization for Unsupervised Audiovisual Document Structuring
-
Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features
-
Efficient Estimation of Word Representations in Vector Space
-
Beyond Text QA: Multimedia Answer Generation by Harvesting Web Information
-
Structured Streaming Skeleton (SSS): 온라인 인간 제스처 인식용 새로운 특징 추출 방법