Discriminative Segment Annotation in Weakly Labeled Video
Source
Evernote/Papers/Discriminative Segment Annotation in Weakly Labeled Video.md
Summary
이 논문은 약한 라벨(weakly labeled)이 부여된 복잡한 인터넷 영상에서 시각적 개념에 해당하는 시공간적 세그먼트(spatiotemporal segments)를 자동으로 분류하고 마스크를 생성하는 문제를 다룹니다. 이를 위해 CRANE 알고리즘을 제안하여, 약한 라벨 데이터를 활용하여 각 세그먼트가 특정 시각적 개념에 해당할 확률을 순위 매깁니다. Prest et al. 데이터셋의 부분 집합에 대해 세그먼트 수준의 주석을 공개했으며, Hartmann et al.의 대규모 객체 분할 데이터셋에서 state-of-the-art 결과를 보였습니다.
Key Points
- 약한 라벨이 있는 영상에서 시각적 개념에 대한 시공간적 마스크 자동 생성
- CRANE 알고리즘 제안: 약한 라벨 영상을 기반으로 세그먼트의 개념 일치 가능성 순위 매기기
- Prest et al. 데이터셋의 세그먼트 수준 주석 공개
- Hartmann et al. 데이터셋에서 state-of-the-art 성능 달성
Related
-
Weakly Supervised Learning of Object Segmentations from Web-Scale Video
-
웹 데이터베이스 검색 결과 자동 주석 처리 (Automatic Annotation of Web Database Search Results)
-
A Hamming Embedding Kernel with Informative Bag-of-Visual Words for Video Semantic Indexing
-
Smooth Nonnegative Matrix Factorization for Unsupervised Audiovisual Document Structuring
-
Efficient Closed-Form Solution to Generalized Boundary Detection
-
언어 독립적 시간 표현 판별적 파싱 (Language-Independent Discriminative Parsing of Temporal Expressions)
-
Active Learning through Adaptive Heterogeneous Ensembling (AHE)
-
Fast Near-Duplicate Image Detection Using Uniform Randomized Trees
-
Feature Ensemble Plus Sample Selection: Domain Adaptation for Sentiment Classification
-
Efficient Inference and Structured Learning for Semantic Role Labeling
-
Efficient Estimation of Word Representations in Vector Space
-
Social Event Classification via Boosted Multimodal Supervised Latent Dirichlet Allocation
-
Point Representation for Local Optimization: Towards Multi-Dimensional Gray Codes
-
Regularized Latent Semantic Indexing (RLSI): 대규모 토픽 모델링을 위한 새로운 접근법
-
Similarity-based Clustering by Left-Stochastic Matrix Factorization
-
Near-duplicate video retrieval: Current research and future trends
-
Neighborhood Preserving Codes for Assigning Point Labels: Applications to Stochastic Search
-
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine (Technical Supplement)
-
Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features
-
Enlisting the Ghost: Modeling Empty Categories for Machine Translation
-
When Amazon Meets Google: Product Visualization by Exploring Multiple Web Sources
-
Protecting Sensitive Labels in Social Network Data Anonymization
-
An Unsupervised Feature Selection Framework for Social Media Data