Improved Domain Adaptation for Statistical Machine Translation
Source
Evernote/Papers/Improved Domain Adaptation for Statistical Machine Translation.md
Summary
이 논문은 통계적 기계 번역(SMT)을 위한 도메인 적응(domain adaptation) 인프라를 제안합니다. 단일 번역 시스템을 훈련, 튜닝 및 배포하여 특정 도메인에 적응된 번역을 생성하면서도 원래의 일반적 정확도를 유지합니다. 자동 도메인 감지와 도메인 모델 파라미터화를 하나의 시스템으로 통합하며, 20개 언어 쌍에 대한 실험으로 그 타당성을 입증했습니다.
Key Points
- 통계적 기계 번역(SMT)을 위한 단순하고 효과적인 도메인 적응 인프라 제안
- 단일 시스템으로 도메인 적응 번역 생성 및 기존 일반 정확도 유지 동시 수행
- 자동 도메인 감지와 도메인 모델 파라미터화 통합
- 20개 언어 쌍 실험을 통한 타당성 검증
Related
-
Feature Ensemble Plus Sample Selection: Domain Adaptation for Sentiment Classification
-
Scalable Decipherment for Machine Translation via Hash Sampling
-
Target Language Adaptation of Discriminative Transfer Parsers
-
Speaker Adaptation of Context Dependent Deep Neural Networks
-
Enlisting the Ghost: Modeling Empty Categories for Machine Translation
-
Token and Type Constraints for Cross-Lingual Part-of-Speech Tagging
-
Language Model Verbalization for Automatic Speech Recognition
-
Coordinated Multi-Device Presentations: Ambient-Audio Identification
-
Accurate and Compact Large Vocabulary Speech Recognition on Mobile Devices
-
Speech and Natural Language: Where Are We Now And Where Are We Headed
-
Efficient Estimation of Word Representations in Vector Space
-
Social Event Classification via Boosted Multimodal Supervised Latent Dirichlet Allocation
-
From mixed-mode to multiple devices. Web surveys, smartphone surveys and apps
-
Active Learning through Adaptive Heterogeneous Ensembling (AHE)
-
Behavioural reconfigurable and adaptive data reduction in body sensor networks
-
Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features
-
언어 독립적 시간 표현 판별적 파싱 (Language-Independent Discriminative Parsing of Temporal Expressions)
-
Eureka: Edge-Based Discovery of Training Data for Machine Learning