두나무 데이터 전사: EKS CNI 및 Pod Security Group 설정 장애 분석

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1385. 2025-04-15.md

Summary

두나무 과거 데이터 전사 작업 중 AWS EKS 환경에서 SSO 및 네트워크 설정을 검증하던 중, Pod Security Group(Pod SG) 부여 시 IP 할당 실패 문제가 발생함. 원인은 IP 풀 부족으로 판단되며, AWS_VPC_K8S_CNI_CUSTOM_NETWORK_CFG 활성화 시 IPAMD 통신 문제와 POD_SECURITY_GROUP_ENFORCING_MODE 설정(standard vs strict)에 따른 트래픽 경로(VPC 외부 엔드포인트 시 노드 SG 사용)가 주요 변수로 확인됨. 해결 방안으로 IP Prefix Delegation 설정, NAT 게이트웨이 구성, 또는 기존 설정 초기화 후 재검증을 고려 중임.

Key Points

  • 두나무 데이터 전사 프로젝트에서 디렉토리 분리(증플/업비트) 및 SSO 연동 작업 진행 중
  • EKS VPC CNI 설정에서 POD_SECURITY_GROUP_ENFORCING_MODEAWS_VPC_K8S_CNI_EXTERNALSNAT 조합에 따른 보안 그룹 적용 로직 확인 필요
  • Pod SG 부여는 성공했으나 IP 할당 실패 발생, 근본 원인으로 IP 풀 부족 추정
  • 해결 시도: CUSTOM_NETWORK_CFG 활성화 시 IPAMD 소통 문제 확인, IP Prefix Delegation 또는 NAT GW 설정 대안 검토
  • ENI Trunking 지원 여부 확인 및 관련 문서 참조