A Hamming Embedding Kernel with Informative Bag-of-Visual Words for Video Semantic Indexing

Source

  • Evernote/IFTTT Feedly/A Hamming Embedding Kernel with Informative Bag-of-Visual Words for Video Semantic Indexing.md

Summary

본 논문은 비디오 시맨틱 인덱싱을 위한 기존 Bag-of-Visual Words(BoW) 방식의 한계를 극복하기 위해 해밍 임베딩 커널과 정보량 기반 시각 단어 가중치 부여 방법을 제안합니다. 첫째, SIFT 양자화로 인한 정보 손실을 줄이기 위해 동일 셀 내 키포인트 간 해밍 거리를 SVM 커널에 통합하여 샘플 간 판별력을 높입니다. 둘째, 특정 개념 탐지에 유용한 시각 단어의 정보량(informativeness)에 따라 가중치를 부여하여 개념 특화 시각 정보를 강조합니다.

Key Points

  • 기존 BoW 방식의 정보 손실 문제 해결을 위해 해밍 임베딩(Hamming Embedding) 도입
  • 동일 셀 내 키포인트 간 해밍 거리를 SVM 커널에 통합하여 이미지 샘플 판별력 향상
  • 특정 개념 탐지에 대한 정보량(informativeness)에 따라 시각 단어 가중치 조정
  • 비디오 시맨틱 인덱싱 성능 개선을 위한 두 가지 주요 기법 제안