全部产品
存储与CDN 数据库 安全 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网
云服务器 ECS

云盘三副本技术介绍

更新时间:2017-06-07 13:26:11

阿里云分布式文件系统为 ECS 提供稳定、高效、可靠的数据随机访问能力。

Chunk

ECS 用户对虚拟磁盘的读写最终都会被映射为对阿里云数据存储平台上的文件的读写。阿里云提供一个扁平的线性存储空间,在内部会对线性地址进行切片,一个分片称为一个 Chunk;对于每一个 Chunk,阿里云会复制出三个副本,并将这些副本按照一定的策略存放在集群中的不同节点上,保证用户数据的可靠。

三份副本的原理

在阿里云数据存储系统中,有三类角色,分别称为 Master、Chunk Server,以及 Client。ECS 用户的一个写操作,经过层层转换,最终会交由 Client 来执行,执行过程简要说明如下:

  1. Client 计算出这个写操作对应的 Chunk。
  2. Client 向 Master 查询该 Chunk 的三份副本的存放位置。
  3. Client 根据 Master 返回的结果,向这 3 个 Chunk Server 发出写请求。
  4. 如果三份都写成功,Client 向用户返回成功;反之,Client 向用户返回失败。

Master 的分布策略会综合考虑集群中所有 Chunk Server 的磁盘使用情况,在不同交换机机架下的分布情况、电源供电情况、机器负载情况,尽量保证一个 Chunk 的所有副本分布在不同机架下的不同 Chunk Server 上,有效防止由于一个 Chunk Server 或一个机架的故障导致的数据不可用。

数据保护机制

当有数据节点损坏,或者某个数据节点上的部分硬盘发生故障时,集群中部分 Chunk 的有效副本数就会小于 3。一旦发生这种情况,Master 就会发起复制机制,在 Chunk Server 之间复制数据,使集群中所有 Chunk 的有效副本数达到 3 份。

综上所述,对云盘上的数据而言,所有用户层面的操作都会同步到底层三份副本上,无论是新增、修改还是删除数据。这种模式,能够保障用户数据的可靠性和一致性。

至于 ECS 实例内由于病毒感染、人为误删除或黑客入侵等软故障原因造成的数据丢失,需要采用备份、快照等技术手段来解决。任何一种技术都不可能解决全部的问题,因地制宜的选择合适的数据保护措施,才能为您宝贵的业务数据筑起一道坚实的防线。

本文导读目录