다중 모드 특징 표현 및 시간 피라미드 매칭을 통한 콘텐츠 기반 복제 탐지

Source

  • Evernote/IFTTT Feedly/Content-based copy detection through multimodal feature representation and temporal pyramid matching.md

Summary

본 논문은 워터마킹의 대안으로 부상하는 콘텐츠 기반 복제 탐지(CBCD) 기술에 대해 다룹니다. 복잡한 변환을 거친 영상 복제본을 탐지하기 위해 오디오, 전역/국소 시각 특징의 상호 보완성을 활용하는 다중 모드 특징 표현 기법을 제안합니다. 또한, 시간 피라미드 매칭 알고리즘을 통해 프레임 수준의 유사도 검색 결과를 다양한 시간 해상도에서 평가하여 시퀀스 수준의 매칭 결과로 통합합니다. 검색 속도 향상을 위해 역색인(Inverted Indexing)과 로컬리티 센시티브 해싱(LSH)을 적용했습니다.

Key Points

  • 콘텐츠 기반 복제 탐지(CBCD)는 영상 식별 및 저작권 보호를 위한 워터마킹의 대안 기술로 주목받고 있음
  • 오디오 및 시각(전역/국소) 특징의 다중 모드 표현을 통해 복잡한 변형에 대한 강인성(Robustness) 확보
  • 시간 피라미드 매칭(Temporal Pyramid Matching) 알고리즘을 사용하여 프레임 유사도를 시퀀스 수준으로 통합
  • 역색인 및 LSH 기법을 도입하여 유사도 검색 속도 최적화