Google SyntaxNet 오픈소스 공개 및 원리
Source
Evernote/Article Scraps/Google 자연어 처리 오픈소스 SyntaxNet 공개 - CPUU의 Daydreamin'.md
Summary
구글이 2016년 5월 자연어 처리(NLP) 프레임워크인 SyntaxNet을 오픈소스로 공개했다. TensorFlow 기반의 인공신경망 구문 분석기로, 영어 구문 분석 모델 ‘Parsey McParseface’를 함께 제공하여 별도 학습 없이 즉시 사용 가능하다고 밝혔다. SyntaxNet은 문장의 단어 간 문법적 관계를 의존성 트리(Dependency Parse Tree)로 분석하며, 자연어 처리의 핵심 난제인 모호성(Ambiguity) 해소를 위해 신경망과 Beam Search 알고리즘을 활용하여 가장 그럴듯한 문법 구조를 선택한다.
Key Points
구글이 자연어 이해(NLU)를 위한 구문 분석기 프레임워크 SyntaxNet을 오픈소스로 공개 (2016.05).
TensorFlow 기반이며, 사전 학습된 영어 구문 분석 모델 ‘Parsey McParseface’를 제공하여 별도 학습 없이 활용 가능.
입력 문장의 각 단어에 품사 태깅(POS) 및 문법적 역할(주어, 목적어 등)을 부여하고 의존성 트리 구조로 표현.
자연어의 모호성(예: 전치사 접속 모호성) 해소를 위해 신경망을 통해 단계별 판단을 내리고 Beam Search로 최적의 구문 구조를 탐색.
당시 기준으로 세계에서 가장 높은 정확도를 가진 구문 분석 모델로 소개됨.
Universal Dependency Annotation for Multilingual Parsing
Deep Learning in Speech Synthesis (Google Research Talk)
Source-Side Classifier Preordering for Machine Translation
Facebook, 일부 딥러닝 도구 오픈소스화
Speech and Natural Language: Where Are We Now And Where Are We Headed
영어 책 코퍼스 기반 시계열 구문 N-그램 데이터셋
Biperpedia: 검색 애플리케이션을 위한 온톨로지
ClangMR: 대규모 C++ 코드베이스 자동 리팩토링 시스템
페이스북, Torch용 딥러닝 기술 오픈소스 공개
AppScale: Google App Engine 호환 오픈소스 PaaS
Language Modeling Capitalization
ReFr: 오픈소스 리랭커 프레임워크
UC Berkeley BDD100K 데이터셋 공개
Google Cloud Platform GitHub 조직 공개
Google Glass 작동 원리
Hacking for change at Google
Google Compute Engine GA 발표 (2013)
O 2013 Data Sensing Lab: GCP와 IoT의 만남
O 2013 데이터 센싱 랩: GCP와 IoT의 만남
모바일 음성 검색을 위한 Google 쿼리 스트림의 언어 모델링 경험적 탐색
O)
Git과 Mercurial 비교 분석 (Google Code DVCS 도입 검토)
Nest Learning Thermostat 개발자용 API 공개
Google Cloud Platform(GCP)의 핵심 차별점: 네트워크와 개발자 생태계
Google X Project: 문샷(Moon Shot) 접근법
Google Maps Engine Pro: 비즈니스 데이터 시각화 도구
Earth Reader: 오픈소스 로컬 RSS 리더
서울시 Linked Data 베타 서비스 및 관련 행사 안내 (2013)
B 테스트 플랫폼화
Mobile Backend Starter (MBS) 개요
O 2013 실험 사례 연구
개발자의 데이터 레이스 탐지 도구 사용 현황 (Google 사례)
구글 비교 도구 (Google Comparison Tool)
CPI2: 공유 컴퓨터 클러스터용 CPU 성능 격리
Project Loon: Google X 의 고층 풍선을 이용한 인터넷 접근성 프로젝트
Google 검색 알고리즘 ‘Hummingbird’ 업데이트
Google Disease Trends: An Update
Google Glass SDK 및 GDK 해커톤 발표 (2013)
Google Trust Services 및 자체 루트 CA 운영 시작
Feedly, Google Reader 종료에 대비해 주요 RSS 앱들과 API 파트너십 체결
구글 코더(Google Coder)를 통한 라즈베리파이 웹서버 구축
Google uProxy: P2P 인터넷 검열 우회 도구
구글 GKE 네트워크 기본 보안
Google Research Archive Paper 40700
Windows에서 Google Cloud Printing 및 프린터 공유 활성화 방법
GlassBattle: Google Glass 기반 배틀십 게임
Feedspot: Google Reader 대체 서비스 및 주요 기능
Google Portable Native Client (PNaCl)
Feedly, Google Reader 대체 서비스로 제 3 자 앱 연동 지원 발표
Google Web Designer 출시 예정 (2013)
Warmly, Vine, Google Keyboard, and More
Google PubSubHubbub(PuSH) 허브 개선 및 Feed API 안내
Glassnost: Google Glass 실시간 피드백 사진 공유 앱
Google Keep 코드 분석: Drive 및 비디오 통합 가능성
Optimizing Google’s Warehouse Scale Computers: The NUMA Experience
구글 빅쿼리, 피어슨 상관분석 기능 추가
한국데이터사이언스학회 창립기념 심포지엄 개요
버진 그룹, 세계 최대 인터넷 위성 군단 발사 계획
Google Reader 의 몰락과 RSS 대체 서비스
구글 검색을 타이머로 활용하기
GitHub의 SHA-1 충돌 공격 탐지 및 대응
2011년 KTH H3 개발자 컨퍼런스 Git 발표 자료
Google Drive 출시 시 변화 회피 심리 최소화 사례 연구
네이버 웹문서 검색 가이드라인 공식 발표 (2013)
심층 신경망을 이용한 통계적 파라미터 음성 합성
크로스 플랫폼 SSO 기술 (Cross-Platform SSO)
Wise.io: 기업용 머신러닝 서비스 출시
Accurate and Compact Large Vocabulary Speech Recognition on Mobile Devices
KamitaniLab DeepImageReconstruction 데이터 및 데모 코드
Google Classroom 출시 및 개요
gkeepapi 기반 Google Keep 미디어 자동화 파이프라인
SmartThings 개발자 툴킷 공개 및 오픈 플랫폼 전략
Google Stadia 출시 정보 및 핵심 기능 요약
Heartbeat (블로그 업데이트)
Nowcasting with Google Trends
음성 품질 지표의 배경 소음 및 네트워크 열화에 대한 강건성 비교 (VISQOL, PESQ, POLQA)
대규모 분산 음향 모델링 및 백오프 N-그램
iVector-based Acoustic Data Selection
Safari Books Online 의 Google BigQuery 비즈니스 인텔리전스 활용 사례
Ingress 게임 설명용 신규 비디오 공개
트위터, ‘스톰-하둡’ 연동 기술 OSS로 공개
DurIAN_4S: 말하기 데이터로부터 노래 합성 학습
AGC 및 다중 스타일 학습을 통한 소형 키워드 스포팅
Optimizing Google’s Warehouse Scale Computers: The NUMA Experience
SOINN (Self-Organizing Incremental Neural Network)
MIT Auto-ID Labs, ‘Cloud of Things’ 이니셔티브 발표
데이터 분석 및 머신러닝 오픈소스 기술 12종 (2015)
Recurrent Neural Networks for Voice Activity Detection
IoTivity: IoT 표준을 위한 오픈소스 프레임워크
Fluent 2016: 불변 데이터 구조 (Immutable Data Structure)
Improved Domain Adaptation for Statistical Machine Translation
IoT Toolkit: 오픈소스 IoT 상호운용성 플랫폼