Day 69: AWS 장애 대응 및 멀티리전 확장 준비

Source

  • Field Notes/ReturnZero/Daily Notes/Day 69. 2021-09-07.md

Summary

2021-09-07 일지. AWS 인스턴스 용량 부족으로 인한 장애 발생 및 업스케일링 시도 실패에 대한 대응 기록. 임시 조치로 샌드박스 인스턴스 연결 및 Ansible 자동 재실행 스크립트 개발 진행. 향후 서울, 도쿄, GCP 등 멀티리전 Kubernetes 환경 구축 및 GPU 가동을 위한 논의가 이루어짐. 또한 위지윅 에디터의 S3 이미지 업로드 기능 확인 및 Redis/Kaldi 서비스 연결 문제 해결 과정과 Python 코드 포맷팅 설정(flake8/black/isort) 공유가 포함됨.

Key Points

  • AWS 용량 부족으로 인한 인스턴스 생성 실패 및 장애 대응
  • 임시 조치: 샌드박스 Triton 인스턴스 연결 및 Ansible 자동 재실행 스크립트 작성
  • 멀티리전(서울, 도쿄, GCP) Kubernetes 환경 구축 및 GPU 지원 필요성 제기
  • 위지윅 에디터 내 S3 이미지 업로드 기능 동작 여부 확인
  • Redis 연결 문제 해결을 위한 telnet/traceroute 진단 방법 공유
  • Python 프로젝트 코드 스타일 설정(flake8, black, isort) 표준화 논의