Cross-Media Tag Transfer (CMTT): 이미지에서 비디오로 태그 지식 이전
Source
Evernote/Inbox/Effective transfer tagging from image to video.md
Summary
본 논문은 웹상의 사용자 생성 비디오에 대한 효율적인 검색을 위해, 비디오 자체의 학습 데이터 부족 문제를 해결하고자 한다. 이를 위해 풍부하게 태그된 이미지 데이터를 활용하여 비디오에 의미 있는 키워드를 자동으로 부여하는 ‘Cross-Media Tag Transfer (CMTT)’ 프레임워크를 제안한다. 핵심 기법은 이미지와 비디오 간에 ‘크로스 미디어 터널(cross-media tunnel)‘을 구축하여 이미지의 태그 지식을 비디오로 이전하는 것이다.
Key Points
- 비디오 검색 엔진의 자동 태그 부여 성능 향상을 위한 연구
- 비디오 학습 데이터 부족 문제 해결을 위해 잘 태그된 이미지 데이터 활용
- Cross-Media Tag Transfer (CMTT) 프레임워크 제안
- 이미지에서 비디오로의 지식 이전을 위한 ‘크로스 미디어 터널’ 구축
Related
-
A Hamming Embedding Kernel with Informative Bag-of-Visual Words for Video Semantic Indexing
-
Weakly Supervised Learning of Object Segmentations from Web-Scale Video
-
Efficient Closed-Form Solution to Generalized Boundary Detection
-
Smooth Nonnegative Matrix Factorization for Unsupervised Audiovisual Document Structuring
-
Social Event Classification via Boosted Multimodal Supervised Latent Dirichlet Allocation
-
Feature Ensemble Plus Sample Selection: Domain Adaptation for Sentiment Classification
-
언어 독립적 시간 표현 판별적 파싱 (Language-Independent Discriminative Parsing of Temporal Expressions)
-
Active Learning through Adaptive Heterogeneous Ensembling (AHE)
-
Fast Near-Duplicate Image Detection Using Uniform Randomized Trees
-
Enlisting the Ghost: Modeling Empty Categories for Machine Translation
-
An Unsupervised Feature Selection Framework for Social Media Data
-
Efficient Inference and Structured Learning for Semantic Role Labeling
-
Point Representation for Local Optimization: Towards Multi-Dimensional Gray Codes
-
Neighborhood Preserving Codes for Assigning Point Labels: Applications to Stochastic Search
-
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine (Technical Supplement)
-
Similarity-based Clustering by Left-Stochastic Matrix Factorization
-
Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features
-
Regularized Latent Semantic Indexing (RLSI): 대규모 토픽 모델링을 위한 새로운 접근법
-
Efficient Estimation of Word Representations in Vector Space
-
Improved Domain Adaptation for Statistical Machine Translation
-
웹 데이터베이스 검색 결과 자동 주석 처리 (Automatic Annotation of Web Database Search Results)
-
Unsupervised Spatial Event Detection in Targeted Domains with Applications to Civil Unrest Modeling
-
Protecting Sensitive Labels in Social Network Data Anonymization
-
Near-duplicate video retrieval: Current research and future trends