AWS CloudWatch Metrics 및 알람 설정 가이드 (DevOps Day 1)

Source

  • Evernote/Inbox/100 Days of DevOps — Day 1(Introduction to CloudWatch Metrics).md

Summary

본 문서는 AWS CloudWatch 의 기본 개념과 EC2 인스턴스에 대한 모니터링 설정 방법을 다룹니다. CloudWatch 가 수집하는 기본 메트릭(CPU, 네트워크, 디스크) 과 상태 확인(System/Instance Status Check) 의 차이를 설명하며, CPU 사용률이 70% 를 초과할 경우 SNS 를 통해 이메일 알림을 보내는 알람을 AWS Console 과 CLI 를 사용하여 설정하는 구체적인 단계를 제시합니다. 또한 기본 모니터링 (5 분 간격) 과 상세 모니터링 (1 분 간격) 의 차이점 및 비용, 온프레미스 환경에서의 에이전트 설치 가능성에 대해 언급합니다.

Key Points

  • CloudWatch 는 AWS 리소스와 애플리케이션의 실시간 메트릭 수집 및 추적을 담당합니다.
  • EC2 기본 메트릭: CPU, 네트워크, 디스크 사용량 및 상태 확인 (System/Instance Status Check).
  • System Status Check: 물리적 호스트의 하드웨어/네트워크 문제 감지 (AWS 개입 필요 가능).
  • Instance Status Check: 인스턴스 내부의 소프트웨어/네트워크 구성 문제 감지 (사용자 개입 필요).
  • 기본 모니터링은 5 분 간격이며, 상세 모니터링 (1 분 간격) 은 추가 비용이 발생합니다.
  • 실습 예제: CPU 사용률 > 70% 지속 시 SNS 알림을 발송하는 CloudWatch 알람 생성 (Console 및 CLI 방식).
  • 알람 설정 시 누락된 데이터 처리 옵션 (bad/breaching) 과 SNS 구독 확인 절차가 포함됩니다.