Iustitia: 정보 이론적 접근을 통한 고속 플로우 성격 식별

Source

  • Evernote/IFTTT Feedly/An Information-Theoretical Approach to High-Speed Flow Nature Identification.md

Summary

이 논문은 네트워크 플로우의 내용 성격(텍스트, 바이너리, 암호화)을 실시간으로 식별하는 프레임워크 ‘Iustitia’를 제안합니다. 텍스트는 엔트로피가 가장 낮고, 암호화 데이터는 가장 높으며, 바이너리 데이터는 그 중간 값을 가진다는 관찰을 기반으로 합니다. 연속된 바이트의 엔트로피를 특징으로 사용하는 머신러닝 기법을 적용하여, 이미지/비디오/실행 파일 등 바이너리 하위 유형 및 파일 포맷(JPEG, GIF, MPEG 등)까지 세분화 분류합니다. 실험 결과, 1K 버퍼 크기에서 평균 88.27%의 정확도를 달성하며, 91.2%의 플로우에서 패킷 도착 시간의 10% 미만으로 고속 분류가 가능합니다.

Key Points

  • 플로우의 내용 성격(텍스트/바이너리/암호화) 실시간 식별 프레임워크 ‘Iustitia’ 제안
  • 엔트로피 기반 분류: 텍스트(최저 엔트로피) < 바이너리(중간) < 암호화(최고 엔트로피)
  • 연속 바이트 엔트로피를 특징으로 하는 머신러닝 기반 분류
  • 바이너리 플로우의 세분화: 유형(이미지/비디오/실행파일) 및 파일 포맷(JPEG/GIF/MPEG 등) 식별 가능
  • 성능: 1K 버퍼 기준 평균 88.27% 정확도, 패킷 도착 시간의 10% 미만으로 고속 처리