Omega: 대규모 컴퓨팅 클러스터를 위한 유연하고 확장 가능한 스케줄러
Source
Evernote/IFTTT Feedly/Omega flexible, scalable schedulers for large compute clusters.md
Summary
기존의 단일(monolithic) 클러스터 스케줄러 아키텍처는 규모 증가와 빠른 요구사항 변경에 대응하기 어렵습니다. 본 논문은 병렬성, 공유 상태, 그리고 락 없는 낙관적 동시성 제어(lock-free optimistic concurrency control)를 활용하여 이러한 문제를 해결하는 새로운 접근법인 ‘Omega’를 제시합니다. 실제 Google 프로덕션 워크로드를 기반으로 기존 설계와의 비교, 스케줄러 간 간섭 분석 및 완화 기법, 그리고 실제 사용 사례를 통해 Omega의 장점을 입증합니다.
Key Points
- 기존 단일 스케줄러 아키텍처의 확장성 및 기능 배포 속도 한계 지적
- 병렬성, 공유 상태, 락 없는 낙관적 동시성 제어를 활용한 Omega 아키텍처 제안
- 실제 Google 프로덕션 워크로드를 통한 성능 평가 및 스케줄러 간 간섭 분석
- 스케줄러 간 간섭을 완화하는 기법 및 실제 사용 사례 제시
Related
-
Optimizing Google’s Warehouse Scale Computers: The NUMA Experience
-
Optimizing Google’s Warehouse Scale Computers: The NUMA Experience
-
Truthful Mobile Crowdsensing for Strategic Users With Private Data Quality
-
A Prediction-Based User Selection Framework for Heterogeneous Mobile CrowdSensing
-
Developing Parallel Control and Management for Urban Traffic Systems
-
Online Graph Edge-Coloring in the Random-Order Arrival Model
-
Network-Wide Local Unambiguous Failure Localization (NWL-UFL) via Monitoring Trails
-
Backward Path Growth for Efficient Mobile Sequential Recommendation
-
지연 기반 네트워크 유틸리티 최대화 (Delay-Based Network Utility Maximization)
-
Eureka: Edge-Based Discovery of Training Data for Machine Learning
-
Regularized Latent Semantic Indexing (RLSI): 대규모 토픽 모델링을 위한 새로운 접근법
-
Multi-Armed Recommendation Bandits for Selecting State Machine Policies for Robotic Systems