监控突发性能实例

本文介绍如何通过ECS管理控制台查看突发性能实例的CPU使用率和CPU积分,并通过云监控管理控制台设置CPU积分报警规则。

前提条件

如果您需要设置通知对象,您必须提前创建联系人组。具体操作,请参见创建报警联系人或报警联系人组

背景信息

由于突发性能实例的CPU积分变化直接影响CPU使用率和实例负载性能,您可以在云监控管理控制台对一台或多台突发性能实例设置已消耗CPU积分、累积CPU积分、超额CPU积分或者预支CPU积分的监控报警方案。突发性能实例CPU积分的监控指标说明如下表所示。

监控指标

说明

突发性能实例-已消耗CPU积分

消耗CPU积分的变化,趋势和CPU使用率保持同步。更多信息,请参见CPU积分

突发性能实例-累积CPU积分

CPU积分余额的变化,用于维持CPU使用率的CPU积分。更多信息,请参见CPU积分

突发性能实例-超额CPU积分

超额CPU积分的变化,仅打开无性能约束模式后会消耗超额CPU积分。更多信息,请参见性能模式

突发性能实例-预支CPU积分

预支CPU积分的变化,仅打开无性能约束模式后会消耗预支CPU积分。更多信息,请参见性能模式

查看CPU积分使用信息

以下步骤示范了如何通过ECS管理控制台查看突发性能实例的积分实时变化曲线。

  1. 登录ECS管理控制台

  2. 在左侧导航栏,选择实例与镜像 > 实例

  3. 在页面左侧顶部,选择目标资源所在的资源组和地域。地域

  4. 找到指定突发性能实例,单击实例ID,进入实例详情页面。

  5. 单击监控页签,查看相关CPU积分使用信息以及CPU使用率。

    说明
    • 您在ECS管理控制台查看的CPU使用率是云服务器内部操作系统监控的CPU使用率,不作为CPU积分消耗依据。

    • CPU积分消耗所基于的CPU使用率是在物理机层面采集的(包含了云服务器内部特权指令的模拟开销),您可以登录云监控管理控制台,在主机监控页面单击实例ID,然后在基础监控页签中查看相关数据。更多信息,请参见主机监控概览

创建CPU积分报警规则

以下步骤示范了如何通过云监控管理控制台创建突发性能实例-累积CPU积分以及突发性能实例-超额CPU积分报警规则。其中:

  • 在性能约束模式下,如果突发性能实例没有可用的CPU积分,CPU使用率无法超过基准性能。因此监控突发性能实例-累积CPU积分可以保证您在实例性能受限的情况下收到通知,决定是否打开无性能约束模式。

  • 在无性能约束模式下,为保持CPU使用率超过基准性能,如果突发性能实例消耗了所有预支积分后还需要使用超额CPU积分,超额CPU积分按小时出账单并收取费用。因此监控突发性能实例-超额CPU积分可以保证您在产生超额CPU积分计费时收到通知,决定是否关闭无性能约束模式。

  1. 登录云监控管理控制台

  2. 在左侧导航栏,单击报警服务 > 报警规则

  3. 报警规则页面,单击创建报警规则

  4. 创建报警规则面板,完成以下配置。

    1. 设置实例信息:

      • 产品:选择云服务器ECS

      • 资源范围:选择实例

      • 关联资源:选择一台或多台突发性能实例。

    2. 单击添加规则 > 简单指标,在设置规则描述面板中,设置报警规则:

      • 规则名称:自定义填写。

      • 指标类型简单指标

      • 监控指标阈值及报警级别:设置报警规则以及判断标准。

        • 监控突发性能实例-累积CPU积分:选择实例维度 > (ECS)突发性能实例-累积CPU积分,本文示例中,设置的报警判断标准为以1分钟为周期,持续1分钟突发性能实例-累积CPU积分的平均值都小于1,则触发报警。

          说明

          累积CPU积分小于1时,在性能约束模式下,突发性能实例的CPU使用率将无法超过基准性能;在无性能约束模式下,如果CPU使用率超过基准性能,突发性能实例将开始消耗预支积分和超额CPU积分。根据您对性能约束的容忍程度,您也可以设置为连续多个周期的平均值。

          突发性能实例-累积CPU积分

        • 监控突发性能实例-超额CPU积分: 选择实例维度 > (ECS)突发性能实例-超额CPU积分,本文示例中,设置的报警判断标准为以1分钟为周期,持续1分钟突发性能实例-超额CPU积分的平均值都大于0,则触发报警。

          说明

          超额CPU积分大于0意味着突发性能实例产生了超额积分,开始计费。根据您对超额积分计费的容忍程度,您也可以设置为连续多个周期的平均值。

          突发性能实例-超额CPU积分

        • 监控突发性能实例-已消耗CPU积分:选择实例维度 > (ECS)突发性能实例-已消耗CPU积分

        • 监控突发性能实例-预支CPU积分:选择实例维度 > (ECS)突发性能实例-预支CPU积分

    3. 设置通道沉默周期:选择消息的间隔推送时间。

    4. 设置生效时间:选择您可以接收消息的时间段。

    5. 设置报警联系人组:选择一个联系人通知组。

      如果未设置联系人组,请单击右侧的新建联系人组进行设置。

    6. (可选)设置标签

      告警标签会添加到告警内容中。

    7. 设置高级设置

      • 设置报警回调:公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。

      • 设置推送渠道

        • 弹性伸缩:如果您打开弹性伸缩开关,当报警发生时,会触发相应的伸缩规则。

        • 日志服务:如果您打开日志服务开关,当报警发生时,会将报警信息写入日志服务的日志库。

        • 轻量消息服务队列(原MNS)-topic:如果您打开轻量消息服务队列(原MNS)-topic开关,当报警发生时,会将报警信息写入消息服务的主题。

        • 函数计算:如果您打开函数计算开关,当报警发生时,会将报警通知发送至函数计算进行格式处理。您需要设置函数计算的地域、服务和函数。

      • 设置无数据处理方法:无监控数据时报警的处理方式。默认取值不做任何处理

  5. 单击确认