Approximate Recall Confidence Intervals
Source
Evernote/Papers/Approximate Recall Confidence Intervals.md
Summary
이 논문은 정보 검색(IR)에서 리콜(Recall) 신뢰구간을 추정하는 방법을 분석한다. 특히 법률, 특허, 의료 등 대규모 문서 집합에서 무작위 표본을 통해 리콜을 추정할 때, 기존에 사용되던 정규 근사(Normal approximation) 방법이 많은 상황에서 신뢰구간 포함률(coverage)이 낮고 부적절한 대칭성을 보임을 지적한다. 이에 대해 이항분포의 비율(ratio of binomials)을 기반으로 한 해석적(Analytic) 및 베이지안(Bayesian) 방법이 일반적으로 더 정확하지만, 모집단이 작을 때는 부정확할 수 있음을 발견했다.
Key Points
- 대규모 문서 집합에서 리콜 추정을 위한 무작위 표본 기반 방법의 신뢰성 평가 필요성 제기
- 기존 정규 근사(Normal approximation) 방법의 한계: 많은 상황에서 신뢰구간 포함률이 낮고 대칭성 보정에도 불구하고 부정확함
- 이항분포 비율 기반의 해석적 및 베이지안 방법이 일반적으로 더 정확함
- 소규모 모집단에서는 이항분포 기반 방법도 부정확할 수 있음
Related
-
Patent Query Formulation by Synthesizing Multiple Sources of Relevance Evidence
-
Semantic contextual advertising based on the open directory project
-
Enlisting the Ghost: Modeling Empty Categories for Machine Translation
-
Beyond Text QA: Multimedia Answer Generation by Harvesting Web Information
-
A term-based inverted index partitioning model for efficient distributed query processing
-
Supporting Flexible, Efficient, and User-Interpretable Retrieval of Similar Time Series
-
Efficient Estimation of Word Representations in Vector Space
-
Semantic content-based recommendation of software services using context
-
Structured Streaming Skeleton (SSS): 온라인 인간 제스처 인식용 새로운 특징 추출 방법