영어 책 코퍼스 기반 시계열 구문 N-그램 데이터셋
Source
Evernote/IFTTT Feedly/A Dataset of Syntactic-Ngrams over Time from a Very Large Corpus of English Books.md
Summary
Yoav Goldberg와 Jon Orwant가 작성한 이 논문은 방대한 영어 책 코퍼스를 기반으로 시간의 흐름에 따른 구문 N-그램(syntactic-ngrams)의 변화를 분석하는 데이터셋을 소개합니다. Google Research에서 발행된 이 연구는 언어의 구문 구조가 시간에 따라 어떻게 진화하는지를 정량적으로 추적할 수 있는 자원을 제공합니다.
Key Points
- 방대한 영어 책 코퍼스에서 추출한 시계열 구문 N-그램 데이터셋 제공
- 시간에 따른 영어 구문 구조의 변화 추이 분석 가능
- 저자: Yoav Goldberg, Jon Orwant (Google Research)
Related
-
Supporting Flexible, Efficient, and User-Interpretable Retrieval of Similar Time Series
-
Accurate and Compact Large Vocabulary Speech Recognition on Mobile Devices
-
Efficient Estimation of Word Representations in Vector Space
-
Speech and Natural Language: Where Are We Now And Where Are We Headed
-
Patent Query Formulation by Synthesizing Multiple Sources of Relevance Evidence
-
Continuous Birdsong Recognition Using Gaussian Mixture Modeling of Image Shape Features
-
Coordinated Multi-Device Presentations: Ambient-Audio Identification
-
Improved Domain Adaptation for Statistical Machine Translation
-
Language Model Verbalization for Automatic Speech Recognition
-
Speaker Adaptation of Context Dependent Deep Neural Networks
-
Target Language Adaptation of Discriminative Transfer Parsers
-
A term-based inverted index partitioning model for efficient distributed query processing
-
Token and Type Constraints for Cross-Lingual Part-of-Speech Tagging
-
Scalable Decipherment for Machine Translation via Hash Sampling
-
언어 독립적 시간 표현 판별적 파싱 (Language-Independent Discriminative Parsing of Temporal Expressions)
-
Enlisting the Ghost: Modeling Empty Categories for Machine Translation
-
Structured Streaming Skeleton (SSS): 온라인 인간 제스처 인식용 새로운 특징 추출 방법