영어 책 코퍼스 기반 시계열 구문 N-그램 데이터셋

Source

  • Evernote/IFTTT Feedly/A Dataset of Syntactic-Ngrams over Time from a Very Large Corpus of English Books.md

Summary

Yoav Goldberg와 Jon Orwant가 작성한 이 논문은 방대한 영어 책 코퍼스를 기반으로 시간의 흐름에 따른 구문 N-그램(syntactic-ngrams)의 변화를 분석하는 데이터셋을 소개합니다. Google Research에서 발행된 이 연구는 언어의 구문 구조가 시간에 따라 어떻게 진화하는지를 정량적으로 추적할 수 있는 자원을 제공합니다.

Key Points

  • 방대한 영어 책 코퍼스에서 추출한 시계열 구문 N-그램 데이터셋 제공
  • 시간에 따른 영어 구문 구조의 변화 추이 분석 가능
  • 저자: Yoav Goldberg, Jon Orwant (Google Research)