全部产品
弹性计算 会员服务 网络 安全 移动云 数加·大数据分析及展现 数加·大数据应用 管理与监控 云通信 阿里云办公 培训与认证 更多
存储与CDN 数据库 域名与网站(万网) 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网 智能硬件
云服务器 ECS

实例系统事件

更新时间:2018-03-26 15:14:19

系统事件 是有计划有记录的维护事件。特指因探测到更新维护、违规操作、异常系统故障或者异常软硬件故障时,您需要重新启动实例、停止实例或者释放实例的事件。事件发生的同时会伴有控制台通知、应对措施和事件周期等信息。

一旦发生系统事件,我们及时给您发送通知,通知内容包括实例的默认应对措施和预计执行时间点等,您可以在系统事件执行之前及时备份数据、做好应用层面的准备进而防备对业务的可靠性和连续性的潜在影响。对于已处理的系统事件,您可以查询过去两个月内实例的历史系统事件,用于故障诊断和复盘分析的数据支撑。

ECS 实例是您构建业务应用的核心基础组件,当您完成了实例的 选型购买、初始化配置并开始部署业务时,实例的健康状态对于您的业务连续性和系统可靠性有关键作用。为提升系统可靠性、系统性能和安全防护能力,主动对实例所宿的物理服务器做日常维护并修复潜在的软硬件等系统故障;当探测到物理服务器出现故障或者隐患时,也会及时将实例在线热迁移到健康的服务器,以保持实例的健康运行状态。这些维护是日常维护。日常维护有别于系统事件,日常维护通常是在线完成的,不会发送维护通知,也不对实例造成任何影响。

适用产品

已停售的实例规格 c1、c2、m1、m2、s1、s2、s3 和 t1 等之外,所有的实例规格族均支持系统事件功能。更多详情,请参阅 实例规格族

事件类型

系统事件的类型如下表所示。

事件类型 事件说明 对应参数
实例重启 实例重新启动 Reboot
因系统错误实例重新启动 SystemFailure.Reboot

事件状态

系统事件的生命周期中,有如下事件状态。

事件状态 状态属性 状态描述
待执行 中间状态 系统事件已发生,但尚未执行
已避免 稳定状态 您在 用户操作时间窗口期 内提前操作,避免了系统事件在计划时间点执行
执行中 中间状态 系统事件正在被执行中
已执行 稳定状态 完成系统事件执行
已取消 稳定状态 云服务器 ECS 主动取消了已计划的系统事件
失败 稳定状态 系统事件执行失败

事件窗口

一旦发生系统事件,阿里云会给您发送系统事件计划通知,并在特定的时间段内执行默认应对动作。

  • 用户操作窗口期:系统事件计划发起到执行之间的时间。

    在此期间,根据该事件对您业务应用的影响情况,您可以选择阿里云推荐的应对方式提前执行系统事件,或者等待执行默认应对动作。对于云服务器 ECS 主动修复系统故障触发的系统事件,您会提前 48 小时收到计划通知。

  • 事件执行窗口期:若您没有提前应对系统事件,当时间到达预计执行时间点时,便进入 事件执行窗口期

    系统事件通常会在进入 事件执行窗口期 的 6 小时之内执行完成,完成之后您会收到系统事件的执行结果。

    时间窗口

对于突发故障或者违规操作等非技术因素导致的异常系统事件,通常不会存在 用户操作窗口期,只有极其短暂的 事件执行窗口期。一旦发生异常系统事件,阿里云会及时通知您。很抱歉您无法在系统事件执行前准备应对措施。但是,您可以查询历史系统事件用于故障诊断、原因分析或数据复原。

查看系统事件

如果存在系统计划事件,ECS 控制台 待处理事件 按钮上会出现显著标示提醒您查看。单击该按键后进入 待处理事件 > 系统计划事件 页面,在这里您可以看到实例 ID、地域和运行状态等实例相关信息,计划执行的系统事件相关信息,推荐的用户操作和可执行操作按键。

  1. 登录 ECS 管理控制台

  2. 在左侧导航栏里,单击 概览

  3. 概览 页的 常用操作 区域,单击 待处理事件

    待处理事件

  4. 单击 系统计划事件 页签,查看有系统事件的实例列表,并可以在 操作 列执行需要的操作。

    查看系统事件

API 操作:您也可以调用 API DescribeInstancesFullStatus 查询实例的系统事件。

查看历史系统事件

您可以调用 API DescribeInstanceHistoryEvents 查询已经处于非活跃状态的历史事件。

应对建议

您可以通过控制台操作或者 API 调用应对系统事件。从系统事件出发管理云服务器 ECS,可以提高您对云服务器的底层感知能力和自主应对速度,主动应对和优化 ECS 实例运维,为您的业务可靠性和连续性保驾护航。

事件类型 具体原因 建议措施
实例重启事件 实例重新启动 您可以选择以下任一种方法:
  • 在用户操作窗口期内某个合适的时间点 ECS 控制台 重启实例
    注意:在实例内部重启对该类重启系统事件无效。
  • 调用 API RebootInstance
并视情况为实例挂载的磁盘 创建快照 备份数据。
因系统错误实例重新启动 云服务器 ECS 探测到实例宿主物理机出现故障隐患,您无法自行重启,请等待系统默认响应。建议您提高业务层面的高可用性,降低因实例重启带来的的影响,及时备份数据并等待在事件执行窗口期内执行系统事件。
本文导读目录