다중 모드 특징 표현 및 시간 피라미드 매칭을 통한 콘텐츠 기반 복제 탐지
Source
Evernote/IFTTT Feedly/Content-based copy detection through multimodal feature representation and temporal pyramid matching.md
Summary
본 논문은 워터마킹의 대안으로 부상하는 콘텐츠 기반 복제 탐지(CBCD) 기술에 대해 다룹니다. 복잡한 변환을 거친 영상 복제본을 탐지하기 위해 오디오, 전역/국소 시각 특징의 상호 보완성을 활용하는 다중 모드 특징 표현 기법을 제안합니다. 또한, 시간 피라미드 매칭 알고리즘을 통해 프레임 수준의 유사도 검색 결과를 다양한 시간 해상도에서 평가하여 시퀀스 수준의 매칭 결과로 통합합니다. 검색 속도 향상을 위해 역색인(Inverted Indexing)과 로컬리티 센시티브 해싱(LSH)을 적용했습니다.
Key Points
- 콘텐츠 기반 복제 탐지(CBCD)는 영상 식별 및 저작권 보호를 위한 워터마킹의 대안 기술로 주목받고 있음
- 오디오 및 시각(전역/국소) 특징의 다중 모드 표현을 통해 복잡한 변형에 대한 강인성(Robustness) 확보
- 시간 피라미드 매칭(Temporal Pyramid Matching) 알고리즘을 사용하여 프레임 유사도를 시퀀스 수준으로 통합
- 역색인 및 LSH 기법을 도입하여 유사도 검색 속도 최적화
Related
-
Near-duplicate video retrieval: Current research and future trends
-
A Hamming Embedding Kernel with Informative Bag-of-Visual Words for Video Semantic Indexing
-
언어 독립적 시간 표현 판별적 파싱 (Language-Independent Discriminative Parsing of Temporal Expressions)
-
Smooth Nonnegative Matrix Factorization for Unsupervised Audiovisual Document Structuring
-
Weakly Supervised Learning of Object Segmentations from Web-Scale Video
-
Efficient Closed-Form Solution to Generalized Boundary Detection
-
Fast Near-Duplicate Image Detection Using Uniform Randomized Trees
-
A Framework for Network Aware Caching for Video on Demand Systems - Errata
-
Structured Streaming Skeleton (SSS): 온라인 인간 제스처 인식용 새로운 특징 추출 방법
-
Feature Ensemble Plus Sample Selection: Domain Adaptation for Sentiment Classification
-
Social Event Classification via Boosted Multimodal Supervised Latent Dirichlet Allocation
-
Point Representation for Local Optimization: Towards Multi-Dimensional Gray Codes