언어 독립적 시간 표현 판별적 파싱 (Language-Independent Discriminative Parsing of Temporal Expressions)
Source
Evernote/Inbox/Language-Independent Discriminative Parsing of Temporal Expressions.md
Summary
기존 시간 해석 시스템이 특정 언어에 종속되어 번역에 많은 노력이 필요했던 문제를 해결하기 위해, 언어 독립적인 시맨틱 파서를 제안합니다. 이 모델은 발화 문구와 해당 시간 정보만으로 학습하며, 언어 유연한 시간 표현을 인코딩하는 잠재 파스(latent parse)와 풍부한 특징 추출을 활용합니다. 사전 정의된 어휘 단서나 언어별 튜닝 없이 약한 지도 학습(weakly supervised bootstrapping) 방식으로 파라미터를 학습합니다. TempEval-2 시간 정규화 작업에서 영어와 스페인어 정확도를 각각 4% 향상시키는 등 최첨단(state-of-the-art) 성능을 달성했으며, 다른 4개 언어에 대해서는 최초로 결과를 보고했습니다.
Key Points
- 특정 언어에 종속되지 않는 언어 독립적 시간 표현 해석 시스템 제안
- 발화 문구와 참조 시간 코퍼스만으로 학습 가능 (어휘 단서/언어별 튜닝 불필요)
- 언어 유연한 시간 표현을 인코딩하는 잠재 파스(latent parse) 및 시맨틱 특징 추출 활용
- 약한 지도 학습(bootstrapping)을 통한 모델 파라미터 학습
- TempEval-2 벤치마크에서 영어/스페인어 정확도 4% 향상 및 타 언어 최초 결과 보고
Related
-
Supporting Flexible, Efficient, and User-Interpretable Retrieval of Similar Time Series
-
Efficient Estimation of Word Representations in Vector Space
-
Weakly Supervised Learning of Object Segmentations from Web-Scale Video
-
A Hamming Embedding Kernel with Informative Bag-of-Visual Words for Video Semantic Indexing
-
Efficient Closed-Form Solution to Generalized Boundary Detection
-
Smooth Nonnegative Matrix Factorization for Unsupervised Audiovisual Document Structuring
-
Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features
-
Semantic content-based recommendation of software services using context
-
Efficient Inference and Structured Learning for Semantic Role Labeling
-
Structured Streaming Skeleton (SSS): 온라인 인간 제스처 인식용 새로운 특징 추출 방법
-
Semantic contextual advertising based on the open directory project
-
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine (Technical Supplement)
-
Feature Ensemble Plus Sample Selection: Domain Adaptation for Sentiment Classification
-
Improved Domain Adaptation for Statistical Machine Translation
-
Social Event Classification via Boosted Multimodal Supervised Latent Dirichlet Allocation
-
Point Representation for Local Optimization: Towards Multi-Dimensional Gray Codes