Fast, Accurate Detection of 100,000 Object Classes on a Single Machine (Technical Supplement)
Source
Evernote/Papers/Fast, Accurate Detection of 100,000 Object Classes on a Single Machine Technical Supplement.md
Summary
본 문서는 CVPR 2013 논문 ‘단일 머신에서 10만 개 객체 클래스의 고속·정확한 탐지’의 기술적 보충 자료입니다. 기존 HOG 기반 Deformable Part Models(DPM)을 해싱하여 근사값으로 추론하는 방식과 달리, WTA(Winner-Take-All) 해시 데이터를 기반으로 DPM을 학습하는 방법을 제안합니다. 이를 통해 희소 실수 벡터 형태의 부분 필터를 생성하고, 지역 민감 해싱(LSH) 확장을 통해 상위 응답의 정확한 내적을 복원하여 점수를 계산합니다.
Key Points
- CVPR 2013 논문(Dean et al.)의 기술적 보충 자료임
- 기존 HOG 기반 DPM의 해싱 근사 방식 대신, WTA 해시 데이터 기반 DPM 학습 방법 제시
- WTA 기반 학습으로 생성된 부분 필터는 희소 실수 벡터 형태임
- 지역 민감 해싱(LSH) 확장을 활용하여 상위 응답의 정확한 내적(dot product)을 복원
Related
-
Weakly Supervised Learning of Object Segmentations from Web-Scale Video
-
Dynamic Time Warping for Music Conducting Gestures Evaluation
-
Fast Near-Duplicate Image Detection Using Uniform Randomized Trees
-
Efficient Closed-Form Solution to Generalized Boundary Detection
-
Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features
-
Structured Streaming Skeleton (SSS): 온라인 인간 제스처 인식용 새로운 특징 추출 방법
-
Point Representation for Local Optimization: Towards Multi-Dimensional Gray Codes
-
Neighborhood Preserving Codes for Assigning Point Labels: Applications to Stochastic Search
-
A Hamming Embedding Kernel with Informative Bag-of-Visual Words for Video Semantic Indexing
-
Smooth Nonnegative Matrix Factorization for Unsupervised Audiovisual Document Structuring
-
Accurate and Compact Large Vocabulary Speech Recognition on Mobile Devices
-
Supporting Flexible, Efficient, and User-Interpretable Retrieval of Similar Time Series
-
Efficient Inference and Structured Learning for Semantic Role Labeling
-
Similarity-based Clustering by Left-Stochastic Matrix Factorization
-
언어 독립적 시간 표현 판별적 파싱 (Language-Independent Discriminative Parsing of Temporal Expressions)
-
Efficient Estimation of Word Representations in Vector Space
-
Intel Research: Context Awareness - Social Proximity Detection