Read-Performance Optimization for Deduplication-Based Storage Systems in the Cloud

Source

  • Evernote/IFTTT Feedly/Read-Performance Optimization for Deduplication-Based Storage Systems in the Cloud.md

Summary

클라우드 백업 및 아카이빙 시스템에서 데이터 중복 제거(Deduplication)는 저장 공간과 네트워크 트래픽을 줄이는 데 효과적이지만, 복원(Read) 성능을 저하시키는 문제가 있다. 이는 파일이나 블록이 중복 제거 과정에서 여러 작은 청크로 분할되어 서로 다른 디스크에 흩어지게 되며, 이로 인해 복원 시 다수의 디스크 I/O가 발생하기 때문이다. 본 논문은 이러한 클라우드 기반 중복 제거 저장 시스템의 읽기 성능 최적화 방안을 다룬다.

Key Points

  • 데이터 중복 제거는 클라우드 저장 시스템의 공간 효율성과 네트워크 대역폭 절감에 기여함.
  • 중복 제거된 데이터의 복원 시 성능 저하가 발생하는 주요 원인은 데이터 청크의 물리적 분산.
  • 파일/블록이 여러 디스크에 흩어진 작은 청크로 저장되면 복원 시 다중 디스크 I/O가 유발되어 읽기 성능이 급감함.
  • 본 연구는 이러한 읽기 성능 병목 현상을 해결하기 위한 최적화 기법을 제시함.