Hoeffding 경계 기반 온라인 및 비모수 드리프트 탐지 방법

Source

  • Evernote/Inbox/Online and Non-Parametric Drift Detection Methods Based on Hoeffding’s Bounds.md

Summary

이 문서는 데이터 스트림 처리 시 발생하는 개념 드리프트(concept drift)를 탐지하기 위한 새로운 온라인 방법을 제안합니다. 학습 모델에 독립적으로 성능 지표를 모니터링하여 분포 변화를 감지하며, Hoeffding 부등식을 활용해 이론적 보장을 제공합니다. 두 가지 주요 접근법으로, 급격한 변화 탐지에 적합한 이동 평균 기반 방법과 점진적 변화 탐지에 적합한 가중 이동 평균 기반 방법을 제시합니다. 단순성과 계산 효율성이 장점이며, Naïve Bayes 및 Perceptron을 통해 합성 및 실제 데이터로 성능을 평가했습니다.

Key Points

  • 온라인/증분 학습 환경에서 개념 드리프트 탐지를 위한 모델 독립적 모니터링 방법 제안
  • 독립적이고 유계인 무작위 변수를 가정하는 Hoeffding 부등식을 활용한 이론적 보장 제공
  • 급격한 변화(Abrupt change) 탐지를 위한 이동 평균 기반 방법
  • 점진적 변화(Gradual change) 탐지를 위한 가중 이동 평균 기반 방법
  • 단순한 구조와 높은 계산 효율성
  • Naïve Bayes 및 Perceptron을 사용한 합성/실제 데이터 기반 성능 평가