响应云盒维修事件

当云盒中的硬件设备发生故障需要更换时,阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。本文为您介绍云盒维修相关的流程,以及如何响应云盒维修事件。

背景信息

配置云盒计算资源时,您需要配置一定的冗余资源或购买SLA服务包,以便在硬件故障时,可以迁移业务。关于如何更好地配置计算资源,请参见云盒计算资源配置最佳实践

流程说明

运行中的ECS实例出现故障风险时,会向您发送ECS故障事件(Reboot事件)通知,收到ECS故障事件通知后,您可以响应故障事件并按照建议进行处理,例如:将现有业务迁移到冗余资源保证业务正常运行,将出现故障风险的ECS实例作为备机(备机仍受阿里云智能运维系统的检测)。更多信息,请参见ECS系统事件概述

如果该故障无法通过阿里云智能运维系统进行自动化修复,则会触发云盒硬件维修事件(SystemFailure.HostOfflineAndRepair事件),通知您授权同意阿里云上门更换并维修硬件设备。涉及的流程如下:

维修事件流程.png

重要

硬件维修采用整机替换的方式现场更换硬件设备,阿里云不在现场进行硬件故障诊断和排查。在您授权同意后,阿里云会按照约定的时间上门更换硬件设备,并将拆除的故障设备运送回阿里云工厂进行维修。具体维修流程,请参见云盒故障服务器维修流程

操作步骤

当您收到云盒维修事件通知时,可以在控制台授权阿里云上门更换硬件设备。

  1. 打开云盒列表页

  2. 单击目标云盒ID。

  3. 在云盒详情页,单击监控页签。

  4. 在页面下方,单击云盒维修页签。

  5. 找到维修事件,进行同意或调整时间操作。

    云盒维修.png

    • 如果同意默认的上门时间,可单击同意

    • 如果不同意默认的上门时间,可单击调整时间,调整后的时间必须在默认上门时间之后。

    说明
    • 根据云盒实际地理位置的差异,系统会自动生成默认上门时间。

    • 同意或调整时间操作后,事件的维修状态会变更为维修中,阿里云会按计划上门更换硬件设备。更换设备后,事件的维修状态会变更为维修完成