관계 추출을 위한 원거리 감독에서 지식 베이스의 간극 메우기
Source
Evernote/IFTTT Feedly/Filling Knowledge Base Gaps for Distant Supervision of Relation Extraction.md
Summary
이 논문은 원거리 감독(Distant Supervision) 기반 관계 추출에서 지식 베이스(KB)의 불완전성으로 인한 위음성(False Negative) 오류 문제를 해결하는 방법을 제안합니다. 기존 KB를 보완하기 위해 유사 관련성 피드백(Pseudo-Relevance Feedback) 기법을 적용하여 상위 랭킹 문맥에서 발견된 엔티피 쌍을 KB에 추가하는 프레임워크를 제시합니다. 실험 결과, 정밀도(Precision)는 약 93%로 유지된 채 재현율(Recall)이 47.7%에서 61.2%로 크게 향상되었습니다.
Key Points
- 문제 정의: 원거리 감독 학습 시 지식 베이스의 불완전성으로 인해 실제 관계가 있는 엔티피 쌍이 학습 데이터에서 누락되는 위음성 오류 발생.
- 해결 방안: 거친 특징(coarse features)을 사용한 문장 검색 모델과 세밀한 특징(fine features)을 사용한 다중 인스턴스 학습 기반 관계 추출기를 결합.
- 핵심 기법: 유사 관련성 피드백(Pseudo-Relevance Feedback)을 활용하여 상위 랭킹 문맥에서 발견된 엔티피 쌍을 KB에 추가하여 지식 베이스 확장.
- 성적: 정밀도 약 93% 유지 하에 재현율 47.7% -> 61.2% 향상.