두나무 프로젝트: 데이터 전사, VGW 업데이트 및 장애 대응 (2025-04-29)

Source

  • Field Notes/ReturnZero/Daily Notes/Day 1399. 2025-04-29.md

Summary

2025 년 4 월 29 일 두나무 프로젝트의 주요 업무 진행 상황을 기록한 일일 노트입니다. 핵심 주제는 과거 데이터 전사 작업의 진도 확인 (4/8) 및 파드 내 S3 업로드를 위한 권한 (SA) 문제 해결, VGW 새 버전 업데이트로 인한 서비스 중단 관리 및 취소 ID 추출, 그리고 STT 관리 시스템 대상 사용자 교육입니다. 또한 새벽 시간대 발생한 아웃바운드 장애에 대한 긴급 대응 (PM 및 브리지텍 수석 참여) 과 해소 과정을 포함합니다.

Key Points

  • 과거 데이터 전사 작업 진행 중이며, 파드 내 변환 및 S3 업로드를 위해 ServiceAccount 권한 설정이 필요함 (kube-system 만 설정된 상태)
  • VGW 새 버전 업데이트로 인한 서비스 중단이 예정되어 있으며, 운영계 배포 전 취소된 ID 추출 작업이 필요함
  • SM 대상을 위한 STT 관리 시스템 사용자 교육 완료
  • 라이선스 인증서 관련 업무 처리
  • 간밤 2 시경 아웃바운드 장애 발생으로 긴급 콜 발생, 관련 담당자 (PM, 브리지텍 수석) 가 새벽 출근하여 대응, 4:30 경 해소