Cross-Domain Feature Learning in Multimedia

Source

  • Evernote/Inbox/Cross-Domain Feature Learning in Multimedia.md

Summary

본 논문은 Web 2.0 환경에서 생성된 다중 모달리티(텍스트, 이미지/비디오 등) 및 다중 도메인(Flickr, YouTube 등) 특성을 가진 멀티미디어 데이터의 효과적인 특징 표현을 위해 ‘Cross-Domain Feature Learning (CDFL)’ 알고리즘을 제안합니다. CDFL은 스택드 노이즈 오토인코더(Stacked Denoising Auto-Encoders)를 기반으로 하며, 모달리티 간 상관관계 제약과 도메인 간 제약을 도입하여 서로 다른 모달리티 간의 상관관계를 최대화하고 도메인 불변의 의미적 특징을 동시에 추출합니다. 감정 분류, 스팸 필터링, 이벤트 분류 등 세 가지 응용 분야에 적용하여 제안된 접근법의 성능을 검증했습니다.

Key Points

  • 문제 정의: Web 2.0 멀티미디어 데이터의 다중 모달리티 및 다중 도메인 특성으로 인한 효과적인 특징 표현의 어려움
  • 제안 방법: 스택드 노이즈 오토인코더 기반의 Cross-Domain Feature Learning (CDFL) 알고리즘
  • 핵심 기법: 모달리티 상관관계 제약(Modal Correlation Constraint) 및 도메인 간 제약(Cross-Domain Constraint) 도입
  • 목표: 모달리티 간 상관관계 최대화 및 도메인 불변 의미적 특징 추출
  • 평가: 감정 분류, 스팸 필터링, 이벤트 분류 응용 분야에서의 성능 검증