由于本地盘不提供数据高可用能力,为提升本地盘的使用体验,阿里云提供了丰富的本地盘运维能力,方便您及时了解本地盘实例是否发生异常并及时采取行动。本文介绍常见的运维场景以及相关系统事件。
常见运维场景
本地盘实例常见的运维场景及相关系统事件如下图所示。

说明 您可以通过修改实例维护属性自定义实例自动恢复的方式,例如实例维护属性为自动重新部署,则在自动恢复实例时默认会进入重新部署实例相关的场景。更多信息,请参见实例维护属性。
弹性裸金属服务器实例还可以安装插件xdragon_hardware_detect_plugin,定期检测弹性裸金属服务器实例上的本地盘的健康状态。具体步骤,请参见安装监控插件。
场景①
SystemMaintenance.Reboot对应的运维流程如下:
SystemMaintenance.Reboot支持的事件状态,请参见ECS系统事件汇总。典型的事件状态变化示意图,请参见系统事件的状态和窗口期。
场景②
SystemMaintenance.Redeploy对应的运维流程如下:
SystemMaintenance.Redeploy支持的事件状态,请参见ECS系统事件汇总。典型的事件状态变化示意图,请参见系统事件的状态和窗口期。
场景③
SystemFailure.Reboot对应的运维流程:
- 系统开始自动重启实例。
- 您收到重启实例的通知。
实例自动重启中,您无需操作,等待完成即可。
- 您检查实例和应用是否正常。
SystemFailure.Reboot支持的事件状态,请参见ECS系统事件汇总。典型的事件状态变化示意图,请参见系统事件的状态和窗口期。
场景④
SystemFailure.Redeploy对应的运维流程:
SystemFailure.Redeploy支持的事件状态,请参见ECS系统事件汇总。典型的事件状态变化示意图,请参见系统事件的状态和窗口期。
场景⑤
针对场景⑤,您可以将实例重新部署到其他宿主机或者仅更换坏盘。
- 重新部署实例可以快速恢复本地盘可用性,但会丢失所有本地盘的数据。具体操作,请参见重新部署本地盘实例。
- 更换坏盘可以保留除坏盘外其他本地盘的数据,对应的运维流程如下:
- 您收到磁盘故障以及计划隔离坏盘的通知。
- 您完成准备工作,包括修改/etc/fstab配置文件、备份数据等。
- 您响应通知,授权隔离坏盘。
- 如果系统事件中包括Reboot关键词,您需要重启实例。
- 阿里云在宿主机上移除坏盘,并插入新盘,然后发送恢复磁盘的通知。
- 您响应通知,授权恢复磁盘。
- 如果系统事件中包括Reboot关键词,您需要重启实例。
说明 更换坏盘需要您和阿里云配合完成,具体操作,请参见隔离损坏的本地盘(控制台)和隔离损坏的本地盘(CLI)。更换坏盘相关系统事件支持的事件状态和对应的变化示意图如下。