Patent Query Formulation by Synthesizing Multiple Sources of Relevance Evidence
Source
Evernote/Inbox/Patent Query Formulation by Synthesizing Multiple Sources of Relevance Evidence.md
Summary
특허 선행기술 검색에서 쿼리 특허의 방대한 텍스트로 인한 정보 필요성 불명확성을 해결하기 위해, 분류 태그 및 문헌정보와 같은 다중 관련성 증거원을 통합한 쿼리 구성 프레임워크를 제안함. 초기 텍스트 기반 쿼리 모델에 인용 그래프 문서의 용어 분포를 확장하여 용어 불일치(term mismatch)를 완화하고, 구식 및 최신 도메인 용어를 함께 모델링함.
Key Points
- 특허 선행기술 검색 시 쿼리 특허의 방대한 용어 수로 인한 정보 필요성 포커싱 어려움 해결 필요
- 분류 태그(classification tags) 및 문헌정보(bibliographical data) 등 다중 관련성 증거원 통합
- 인용 그래프(citation graph) 내 문서의 용어 분포를 활용한 쿼리 확장을 통한 용어 불일치 완화
- 구식 및 최신 도메인 용어 동시 모델링을 통한 검색 성능 향상
Related
-
Supporting Flexible, Efficient, and User-Interpretable Retrieval of Similar Time Series
-
A term-based inverted index partitioning model for efficient distributed query processing
-
Efficient Estimation of Word Representations in Vector Space
-
Beyond Text QA: Multimedia Answer Generation by Harvesting Web Information
-
When Amazon Meets Google: Product Visualization by Exploring Multiple Web Sources
-
Similarity-based Clustering by Left-Stochastic Matrix Factorization
-
Nonlinear Latent Factorization by Embedding Multiple User Interests
-
A Pure Visual Approach for Automatically Extracting and Aligning Structured Web Data