TPCKT: Two-Level Progressive Cross-Media Knowledge Transfer
Source
Evernote/Inbox/TPCKT Two-Level Progressive Cross-Media Knowledge Transfer.md
Summary
본 논문은 크로스미디어 검색(Cross-media retrieval)의 정확도를 높이기 위해 대규모 크로스미디어 데이터에서 소규모 타겟 도메인으로 지식을 이전하는 ‘TPCKT’ 방법을 제안합니다. 주요 특징은 다음과 같습니다: 1) 미디어별 수준과 미디어 공유 수준에서 도메인 판별기를 사용하는 ‘2단계 적대적 이전 아키텍처’를 통해 도메인 간 차이를 줄이고 일관성을 유지합니다. 2) 서로 다른 라벨 공간의 어려움을 해결하기 위해 의미적으로 관련된 카테고리를 점진적으로 선택하는 ‘점진적 의미 이전 메커니즘’을 도입합니다. PKU XMediaNet(소스)과 3개의 소규모 데이터셋(타겟)을 사용한 실험에서 검색 정확도 향상을 입증했습니다.
Key Points
- 크로스미디어 검색에서 라벨링 비용 절감을 위해 기존 데이터에서 새로운 도메인으로 지식 이전(Knowledge Transfer) 수행
- 2단계 적대적 이전 아키텍처: 미디어별 및 미디어 공유 수준의 도메인 판별기 사용으로 도메인 불일치 감소 및 크로스미디어 일관성 유지
- 점진적 의미 이전 메커니즘: 난이도가 상승하는 순서로 의미적으로 관련된 카테고리 선택하여 라벨 공간 차이 해결 및 이전 강건성 확보
- 실험: PKU XMediaNet(대규모 소스 도메인)에서 3개 소규모 타겟 도메인으로 지식 이전 시 검색 정확도 향상 확인
Related
-
Token and Type Constraints for Cross-Lingual Part-of-Speech Tagging
-
Feature Ensemble Plus Sample Selection: Domain Adaptation for Sentiment Classification
-
Social Event Classification via Boosted Multimodal Supervised Latent Dirichlet Allocation
-
Improved Domain Adaptation for Statistical Machine Translation
-
Active Learning through Adaptive Heterogeneous Ensembling (AHE)
-
Enlisting the Ghost: Modeling Empty Categories for Machine Translation
-
Unsupervised Spatial Event Detection in Targeted Domains with Applications to Civil Unrest Modeling
-
An Unsupervised Feature Selection Framework for Social Media Data
-
Target Language Adaptation of Discriminative Transfer Parsers
-
Weakly Supervised Learning of Object Segmentations from Web-Scale Video
-
A Hamming Embedding Kernel with Informative Bag-of-Visual Words for Video Semantic Indexing
-
Protecting Sensitive Labels in Social Network Data Anonymization
-
Smooth Nonnegative Matrix Factorization for Unsupervised Audiovisual Document Structuring
-
Efficient Closed-Form Solution to Generalized Boundary Detection
-
Efficient Inference and Structured Learning for Semantic Role Labeling
-
Moment-Based Spectral Analysis of Large-Scale Networks Using Local Structural Information
-
Efficient Estimation of Word Representations in Vector Space