Efficient Estimation of Word Representations in Vector Space

Source

  • Evernote/Papers/Efficient Estimation of Word Representations in Vector Space.md

Summary

이 논문은 대규모 데이터셋에서 단어의 연속 벡터 표현을 학습하기 위한 두 가지 새로운 모델 아키텍처를 제안합니다. 기존 신경망 기반 기법 대비 계산 비용은 현저히 낮으면서(16억 단어 데이터셋 학습에 1일 미만), 문법적 및 의미적 단어 유사성 측정에서 최첨단(state-of-the-art) 성능을 달성함을 입증합니다.

Key Points

  • 대규모 데이터셋을 위한 효율적인 단어 벡터 학습 모델 2종 제안
  • 기존 신경망 기법 대비 정확도 향상 및 계산 비용 대폭 절감
  • 16억 단어 데이터셋 학습 시간 1일 미만 소요
  • 문법적/의미적 단어 유사성 평가에서 최첨단 성능 달성