查看ECS实例健康状态

实例健康状态表示实例操作系统的运行状态,通过实例健康状态,您可以快速确定ECS实例是否真正可用(例如是否可以通过SSH、RDP等访问)。本文介绍实例健康状态与生命周期状态的区别和关系,以及如何通过ECS控制台或API查看实例健康状态。

实例健康状态说明

  • 实例健康状态关注的是实例操作系统的运行状态,包括操作系统是否正常运行,实例的网络是否连通,CPU或磁盘等性能是否受到影响等。

  • 通过监控实例健康可以及时发现实例操作系统运行状态是否正常。

    例如,实例的生命周期状态为Running,并不意味着实例的操作系统已经运行起来了;只有当实例健康状态为OK时,表示实例的操作系统已经运行起来,才可以通过SSH或RDP进行访问。

  • 实例健康状态每分钟更新一次,您可以根据实例健康状态来识别实例是否存在问题,以便及时处理相应问题。

  • 您可以通过实例健康状态改变通知事件报警规则,及时了解实例健康状态。更多信息,请参见创建系统事件报警规则

  • 实例健康状态与实例生命周期状态之间的区别和对应的场景说明,如下表所示。

    实例生命周期状态(Lifecycle Status)

    实例健康状态(HealthStatus)

    实例健康状态中文描述

    实例真正状态说明

    修复方案

    Starting

    Initializing

    初始化中

    实例正处于初始化阶段。

    等待实例启动。

    Running

    实例操作系统正在启动中。

    等待实例启动。

    Running

    Impaired

    操作系统运行存在异常

    • 实例操作系统正在运行中,但是实例可能受到底层宿主机、存储、网络等限制,导致性能受到影响或降级。

    • 实例操作系统正在运行中,但是遭到OOM出现了蓝屏、夯住(Hang)等问题。

    • 通过启动/重启实例,响应对应实例因操作系统错误需重启事件。

    • 上报故障,等待阿里云处理。

    Running

    OK

    正常

    实例操作系统正在运行中,且实例未受任何外部因素影响。

    Stopping/Stopped

    InsufficientData

    数据不足

    实例处于关机中或已关机状态。

    启动实例。

    Deleted

    NotApplicable

    不适用

    实例当前生命周期状态无效。

查看ECS实例健康状态

在ECS控制台查看实例健康状态

  1. 登录ECS管理控制台

  2. 在左侧导航栏,选择实例与镜像 > 实例

  3. 在页面左侧顶部,选择目标资源所在的资源组和地域。地域

  4. 添加健康状态显示列。

    1. 在实例列表的右上角,单击设置图标图标。

    2. 实例列表设置对话框里,单击未显示区域中健康状态右侧的添加图标,然后单击继续

      image

  5. 找到目标实例,在健康状态列,查看实例健康状态。

    实例健康状态

通过阿里云CLI查看实例健康状态

  • 执行以下命令,调用DescribeInstancesDescribeInstancesFullStatus查看特定实例的健康状态。

    aliyun ecs DescribeInstances --RegionId TheRegionId --output cols=InstanceId,InstanceName rows=Instances.Instance[]
    aliyun ecs DescribeInstancesFullStatus --RegionId TheRegionId --InstanceId.1 i-bp1afnc98r8k69****** --output cols=HealthStatus rows=InstanceFullStatusSet.InstanceFullStatusType[]
  • 执行以下命令,调用DescribeInstancesFullStatus查看指定地域下所有实例的健康状态。

    详细的地域ID列表,请参见地域和可用区

    aliyun ecs DescribeInstancesFullStatus --RegionId TheRegionId --output cols=HealthStatus rows=InstanceFullStatusSet.InstanceFullStatusType[]

发起健康状态检查请求后,阿里云会为请求的每台实例返回健康状态。

说明

返回信息中,HealthStatus表示实例的健康状态,Status表示实例的生命周期状态。

  • 如果实例处于正常状态,则健康状态为OK。

  • 如果实例处于异常状态,则健康状态会返回其他指标。

更多实例健康状态与生命周期状态区别与对应场景说明,请参见实例健康状态说明