在阿里云ECS,您可以对每台实例执行定期检查,监控实例健康状态。本文介绍如何在ECS控制台上或通过API来查看实例健康状况。

背景信息

实例健康状况不同于实例的生命周期状态(例如PendingRunningStopped),实例健康状况侧重于网络配置的异常活动、软件崩溃和硬件使用情况等。通过监视实例健康状态,您可以及时记录网络、软件或硬件问题,以保持您的应用程序在阿里云ECS中持续运行。

同时,配合使用云监控的指标监视功能,您可以灵活地自定义计算资源维护的健康水位。详情请参见云监控

当您发起健康状态检查的请求后,阿里云为执行的每台实例查询返回健康状况。
  • 如果通过了健康状况检查,则健康状况为无异常
  • 如果健康状况检查失败,则健康状况会返回其他指标。
有关健康状况的取值列表,请参见下表:
控制台文案 API参数取值 描述 控制台警示颜色
无异常 OK 已通过健康状况检查 绿色
服务受损 Impaired 实例性能受损 红色
健康预警 Warning 实例性能可能因维护或技术问题而降低
系统维护 Maintaining 实例处于维护中
初始化中 Initializing 正在初始化实例
数据不足 InsufficientData 由于数据不足,无法确定健康状况
无状态 NotApplicable 实例健康状况不适用

在ECS控制台查看实例健康状态

完成以下操作,在ECS控制台查看实例健康状态:

  1. 登录ECS管理控制台
  2. 在左侧导航栏,单击实例与镜像 > 实例
  3. 在顶部状态栏左上角处,选择地域。
  4. 找到要查看健康状态的实例,然后单击实例ID。
  5. 实例详情页面的右上角处,查看实例健康状态。

    查看实例健康状态

通过API查看实例健康状态

本文以阿里云CLI为例示范如何调用ECS API。 关于其他开发者工具的使用说明,请参见ECS API快速入门。详细的地域ID列表请参见地域和可用区

完成以下操作,通过API查看实例健康状态:
  • 执行以下命令,通过调用DescribeInstancesDescribeInstancesFullStatus查看特定实例的健康状态。
    aliyun ecs DescribeInstances --RegionId TheRegionId --output cols=InstanceId,InstanceName
    aliyun ecs DescribeInstancesFullStatus --RegionId TheRegionId --InstanceId.1 i-bp1afnc98r8k69XXXXXX --output cols=HealthStatus
  • 执行以下命令,通过调用DescribeInstancesFullStatus查看指定地域下所有实例的健康状况:
    aliyun ecs DescribeInstancesFullStatus --RegionId TheRegionId --output cols=HealthStatus