Meta-Learning 기반 Instance Selection을 위한 복잡도 측정 지표

Source

  • Evernote/Inbox/A Set of Complexity Measures Designed for Applying Meta-Learning to Instance Selection.md

Summary

본 논문은 메타러닝(Meta-Learning) 관점에서 인스턴스 선택(Instance Selection) 문제를 해결하기 위해 설계된 데이터 복잡도 측정 지표들을 제안한다. 기존 문헌의 복잡도 지표들은 이 목적을 위해 설계되지 않아 메타러닝 적용의 타당성이 불분명했으나, 본 연구는 이전 작업에서 제시한 지표들의 정의를 재검토하고 실험적으로 평가했다. 59개 데이터베이스, 16개 인스턴스 선택 방법, 2개 분류기, 8개 회귀 메타러너를 사용한 실험 결과, 제안된 지표들이 기존 연구자들이 사용하던 전통적 지표들보다 메타러닝 기반 인스턴스 선택에서 더 효율적이고 효과적임이 확인되었다.

Key Points

  • 메타러닝을 통해 데이터셋의 복잡도 측정값만으로 최적의 인스턴스 선택 방법을 결정하는 접근법
  • 기존 데이터 복잡도 지표들이 메타러닝 기반 인스턴스 선택에 적합하지 않음에 대한 문제 제기
  • 메타러닝 기반 인스턴스 선택을 위해 특별히 설계된 복잡도 측정 지표들의 정의 재검토 및 제안
  • 대규모 실험(59 DB, 16 IS 방법, 8 메타러너)을 통한 제안 지표의 유효성 검증
  • 전통적 지표 대비 제안 지표의 효율성 및 효과성 우위 입증