A Hamming Embedding Kernel with Informative Bag-of-Visual Words for Video Semantic Indexing
Source
Evernote/IFTTT Feedly/A Hamming Embedding Kernel with Informative Bag-of-Visual Words for Video Semantic Indexing.md
Summary
본 논문은 비디오 시맨틱 인덱싱을 위한 기존 Bag-of-Visual Words(BoW) 방식의 한계를 극복하기 위해 해밍 임베딩 커널과 정보량 기반 시각 단어 가중치 부여 방법을 제안합니다. 첫째, SIFT 양자화로 인한 정보 손실을 줄이기 위해 동일 셀 내 키포인트 간 해밍 거리를 SVM 커널에 통합하여 샘플 간 판별력을 높입니다. 둘째, 특정 개념 탐지에 유용한 시각 단어의 정보량(informativeness)에 따라 가중치를 부여하여 개념 특화 시각 정보를 강조합니다.
Key Points
- 기존 BoW 방식의 정보 손실 문제 해결을 위해 해밍 임베딩(Hamming Embedding) 도입
- 동일 셀 내 키포인트 간 해밍 거리를 SVM 커널에 통합하여 이미지 샘플 판별력 향상
- 특정 개념 탐지에 대한 정보량(informativeness)에 따라 시각 단어 가중치 조정
- 비디오 시맨틱 인덱싱 성능 개선을 위한 두 가지 주요 기법 제안
Related
-
Weakly Supervised Learning of Object Segmentations from Web-Scale Video
-
Efficient Closed-Form Solution to Generalized Boundary Detection
-
Smooth Nonnegative Matrix Factorization for Unsupervised Audiovisual Document Structuring
-
언어 독립적 시간 표현 판별적 파싱 (Language-Independent Discriminative Parsing of Temporal Expressions)
-
Efficient Inference and Structured Learning for Semantic Role Labeling
-
Point Representation for Local Optimization: Towards Multi-Dimensional Gray Codes
-
Fast Near-Duplicate Image Detection Using Uniform Randomized Trees
-
Neighborhood Preserving Codes for Assigning Point Labels: Applications to Stochastic Search
-
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine (Technical Supplement)
-
Regularized Latent Semantic Indexing (RLSI): 대규모 토픽 모델링을 위한 새로운 접근법
-
Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features
-
Similarity-based Clustering by Left-Stochastic Matrix Factorization
-
Efficient Estimation of Word Representations in Vector Space
-
Active Learning through Adaptive Heterogeneous Ensembling (AHE)
-
Social Event Classification via Boosted Multimodal Supervised Latent Dirichlet Allocation
-
Feature Ensemble Plus Sample Selection: Domain Adaptation for Sentiment Classification
-
Near-duplicate video retrieval: Current research and future trends
-
Structured Streaming Skeleton (SSS): 온라인 인간 제스처 인식용 새로운 특징 추출 방법