阿里云分布式文件系统为ECS提供稳定、高效、可靠的数据随机访问能力。

Chunk

您对云盘的读写最终都会被映射为对阿里云数据存储平台上的文件的读写。阿里云提供一个扁平的线性存储空间,在内部会对线性地址进行切片,一个分片称为一个Chunk。对于每一个Chunk,阿里云会复制出三个副本,并将这些副本按照一定的策略存放在集群中的不同节点上,保证您数据的可靠。



三份副本的原理

在阿里云数据存储系统中,有三类角色,分别称为Master、Chunk Server和Client。您的一个写操作,经过层层转换,最终会交由Client来执行,执行过程简要说明如下:

  1. Client计算出这个写操作对应的Chunk。
  2. Client向Master查询该Chunk的三份副本的存放位置。
  3. Client根据Master返回的结果,向这3个Chunk Server发出写请求。
  4. 如果三份都写成功,Client向您返回成功;反之,Client向您返回失败。

Master的分布策略会综合考虑集群中所有Chunk Server的硬盘使用情况,在不同交换机机架下的分布情况、电源供电情况、机器负载情况,尽量保证一个Chunk的所有副本分布在不同机架下的不同Chunk Server上,有效防止由于一个Chunk Server或一个机架的故障导致的数据不可用。

数据保护机制

当有数据节点损坏,或者某个数据节点上的部分硬盘发生故障时,集群中部分Chunk的有效副本数就会小于3。一旦发生这种情况,Master就会发起复制机制,在Chunk Server之间复制数据,使集群中所有Chunk的有效副本数达到3份。



综上所述,对云盘上的数据而言,所有用户层面的操作都会同步到底层三份副本上,无论是新增、修改还是删除数据。这种模式,能够保障您数据的可靠性和一致性。

如果ECS实例由于病毒感染、人为误删除或黑客入侵等软故障原因造成数据丢失,需要采用备份、快照 等技术手段来解决。任何一种技术都不可能解决全部的问题,因地制宜的选择合适的数据保护措施,才能为您宝贵的业务数据筑起一道坚实的防线。