언어 독립적 시간 표현 판별적 파싱 (Language-Independent Discriminative Parsing of Temporal Expressions)

Source

  • Evernote/Inbox/Language-Independent Discriminative Parsing of Temporal Expressions.md

Summary

기존 시간 해석 시스템이 특정 언어에 종속되어 번역에 많은 노력이 필요했던 문제를 해결하기 위해, 언어 독립적인 시맨틱 파서를 제안합니다. 이 모델은 발화 문구와 해당 시간 정보만으로 학습하며, 언어 유연한 시간 표현을 인코딩하는 잠재 파스(latent parse)와 풍부한 특징 추출을 활용합니다. 사전 정의된 어휘 단서나 언어별 튜닝 없이 약한 지도 학습(weakly supervised bootstrapping) 방식으로 파라미터를 학습합니다. TempEval-2 시간 정규화 작업에서 영어와 스페인어 정확도를 각각 4% 향상시키는 등 최첨단(state-of-the-art) 성능을 달성했으며, 다른 4개 언어에 대해서는 최초로 결과를 보고했습니다.

Key Points

  • 특정 언어에 종속되지 않는 언어 독립적 시간 표현 해석 시스템 제안
  • 발화 문구와 참조 시간 코퍼스만으로 학습 가능 (어휘 단서/언어별 튜닝 불필요)
  • 언어 유연한 시간 표현을 인코딩하는 잠재 파스(latent parse) 및 시맨틱 특징 추출 활용
  • 약한 지도 학습(bootstrapping)을 통한 모델 파라미터 학습
  • TempEval-2 벤치마크에서 영어/스페인어 정확도 4% 향상 및 타 언어 최초 결과 보고