Cross-Domain Feature Learning in Multimedia
Source
Evernote/Inbox/Cross-Domain Feature Learning in Multimedia.md
Summary
본 논문은 Web 2.0 환경에서 생성된 다중 모달리티(텍스트, 이미지/비디오 등) 및 다중 도메인(Flickr, YouTube 등) 특성을 가진 멀티미디어 데이터의 효과적인 특징 표현을 위해 ‘Cross-Domain Feature Learning (CDFL)’ 알고리즘을 제안합니다. CDFL은 스택드 노이즈 오토인코더(Stacked Denoising Auto-Encoders)를 기반으로 하며, 모달리티 간 상관관계 제약과 도메인 간 제약을 도입하여 서로 다른 모달리티 간의 상관관계를 최대화하고 도메인 불변의 의미적 특징을 동시에 추출합니다. 감정 분류, 스팸 필터링, 이벤트 분류 등 세 가지 응용 분야에 적용하여 제안된 접근법의 성능을 검증했습니다.
Key Points
- 문제 정의: Web 2.0 멀티미디어 데이터의 다중 모달리티 및 다중 도메인 특성으로 인한 효과적인 특징 표현의 어려움
- 제안 방법: 스택드 노이즈 오토인코더 기반의 Cross-Domain Feature Learning (CDFL) 알고리즘
- 핵심 기법: 모달리티 상관관계 제약(Modal Correlation Constraint) 및 도메인 간 제약(Cross-Domain Constraint) 도입
- 목표: 모달리티 간 상관관계 최대화 및 도메인 불변 의미적 특징 추출
- 평가: 감정 분류, 스팸 필터링, 이벤트 분류 응용 분야에서의 성능 검증
Related
-
Social Event Classification via Boosted Multimodal Supervised Latent Dirichlet Allocation
-
Feature Ensemble Plus Sample Selection: Domain Adaptation for Sentiment Classification
-
Unsupervised Spatial Event Detection in Targeted Domains with Applications to Civil Unrest Modeling
-
A Hamming Embedding Kernel with Informative Bag-of-Visual Words for Video Semantic Indexing
-
Active Learning through Adaptive Heterogeneous Ensembling (AHE)
-
Weakly Supervised Learning of Object Segmentations from Web-Scale Video
-
Smooth Nonnegative Matrix Factorization for Unsupervised Audiovisual Document Structuring
-
An Unsupervised Feature Selection Framework for Social Media Data
-
Efficient Closed-Form Solution to Generalized Boundary Detection
-
Enlisting the Ghost: Modeling Empty Categories for Machine Translation
-
언어 독립적 시간 표현 판별적 파싱 (Language-Independent Discriminative Parsing of Temporal Expressions)
-
Efficient Inference and Structured Learning for Semantic Role Labeling
-
Efficient Estimation of Word Representations in Vector Space
-
Fast Near-Duplicate Image Detection Using Uniform Randomized Trees
-
Improved Domain Adaptation for Statistical Machine Translation
-
Protecting Sensitive Labels in Social Network Data Anonymization
-
Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features
-
Point Representation for Local Optimization: Towards Multi-Dimensional Gray Codes
-
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine (Technical Supplement)
-
Structured Streaming Skeleton (SSS): 온라인 인간 제스처 인식용 새로운 특징 추출 방법
-
Semantic content-based recommendation of software services using context
-
Neighborhood Preserving Codes for Assigning Point Labels: Applications to Stochastic Search
-
Efficient Multiview Maintenance under Insertion in Huge Social Networks
-
Anomaly Extraction in Backbone Networks Using Association Rules