当宿主机存在故障风险和出现突发故障时,阿里云会通过系统事件方式通知宿主机上的用户,您可以响应该系统事件。在您响应该系统事件时,ECS实例的默认行为是自动重启。如果您希望在这种情况下不自动重启ECS实例,可以通过修改维护属性来调整。

背景信息

实例维护属性本质上指定了ECS实例遇到各种非预期和计划内运维事件后的默认行为,您可以修改实例运维属性定义该默认行为,例如遇到非预期运维事件后默认自动重启还是保持停机状态。实例支持的维护属性及相关说明如下表所示。
说明 您可以自定义实例维护属性,但无法干预进行中的流程。例如,某台实例处于自动重启恢复流程时,修改实例维护属性无法阻止实例重启或改为其他动作。
实例维护属性 相关的系统事件 适用实例类型 说明
自动重启恢复(默认)
  • SystemMaintenance.Reboot
  • SystemFailure.Reboot
所有支持系统事件的实例。 实例恢复至执行运维任务之前的状态:
  • 如果操作前状态为运行中,实例自动重启,继续提供服务。
  • 如果操作前状态为已停止,实例继续处于已停止状态。
禁止重启恢复
  • SystemMaintenance.Stop
  • SystemFailure.Stop
所有支持系统事件的实例。 实例进入已停止状态。适用于您已经在应用层实现故障转移、节点切换等灾备机制的情况,避免多个节点同时提供服务而产生冲突。
自动重新部署
  • SystemMaintenance.Redeploy
  • SystemFailure.Redeploy
仅依赖宿主机硬件的实例,例如挂载本地盘或支持SGX加密计算的实例。相关的规格族信息,请参见实例规格族
说明 实例重新部署后,本地盘数据会被清空,SGX加密拓展会被重置。
实例自动重新部署至其他宿主机,然后继续提供服务。
为充分利用实例的维护属性,建议您通过多种方式提高业务容错率以降低维护操作带来的影响。例如:
  • 将您的核心应用程序(例如SAP HANA)添加到自启动项列表中,避免业务中断。
  • 开启应用程序的自动重新连接功能。例如,允许应用程序自动连接到MySQL、SQL Server或Apache Tomcat。
  • 如果您同时使用了负载均衡服务,请将多台ECS实例部署在集群环境中,当某一台ECS实例处于自动恢复过程中时,其余ECS实例可以继提供业务访问能力。
  • 定期备份本地盘上的数据,以实现数据冗余和提供实例重新部署的数据文件。

操作步骤

  1. 登录ECS管理控制台
  2. 在左侧导航栏,选择实例与镜像 > 实例
  3. 在顶部菜单栏左上角处,选择地域。
  4. 找到目标实例,任选一种方式进入设置项。
    • 方式一:在实例操作列中,选择更多 > 运维和诊断 > 修改实例维护属性
    • 方式二:单击实例ID,进入实例详情页,在页面右上角,选择全部操作 > 运维和诊断 > 修改实例维护属性
  5. 在弹出的修改实例维护属性对话框中,根据您的需求修改,然后单击执行
    • 如果实例只挂载了云盘,您可以选择以下选项:
      • 自动重启恢复
      • 禁止重启恢复
    • 如果实例挂载了本地盘,您可以选择以下选项:
      • 自动重启恢复
      • 禁止重启恢复
      • 自动重新部署
  6. 实例详情页的其它信息区域,确认变更后的维护属性
    查看实例维护属性