创建配额告警

您可以为云产品的通用配额和API速率配额创建配额告警,当配额项的监控指标达到告警条件时,您会收到告警通知,方便您及时申请配额提升。

创建通用配额告警

准备工作

您需要在消息中心设置消息通知方式和消息接收人,用于接收告警消息。具体操作,请参见基本消息接收管理

image

操作步骤

例如:您可以为云服务器ECS的安全组总数量上限(配额为800个)创建配额告警,当实际安全组总数量大于等于配额的80%时,通过短信和邮件给当前阿里云账号发送告警通知。

  1. 登录配额中心控制台

  2. 在左侧导航栏,选择产品列表 > 通用配额

  3. 通用配额列表页面的弹性计算区域,单击云服务器ECS

  4. 单击安全组总数量上限对应操作列的创建告警

    image

  5. 告警规则创建页面,设置告警规则,然后单击确认

    表 1. 通用配额告警规则参数

    参数

    说明

    示例

    规则名称

    配额告警的规则名称。

    安全组总数量上限达到80%

    告警指标

    配额告警的指标。取值:

    • 配额用量

    • 使用率(%)

    • 剩余可用量

    • 剩余可用率(%)

    使用率(%)

    配额告警阈值

    配额告警的阈值。

    • 告警指标选择用量时,如果配额的使用量大于等于阈值,当前阿里云账号会收到告警通知。

    • 告警指标选择使用率(%)时,如果配额的使用率大于等于阈值,当前阿里云账号会收到告警通知。取值范围:[50%, 100%]。

    • 告警指标选择剩余可用量时,如果配额的剩余可用量小于等于阈值,当前阿里云账号会收到告警通知。

    • 告警指标选择剩余可用率(%)时,如果配额的剩余可用率小于等于阈值,当前阿里云账号会收到告警通知。取值范围:(0%, 50%]。

    说明

    通用配额取实时配额值,使用率和剩余可用率根据配额用量和配额计算产生。

    80%

    通知渠道

    默认通过短信和邮件发送告警通知。

    短信和邮件

    告警回调

    告警回调是配额中心提供的一个告警订阅功能。您的运维系统可以根据告警回调内容发起配额提升流程,实现自动化提升配额。

    配额中心将告警信息通过HTTP协议的POST请求发送到您指定的公网URL地址。

    告警回调的请求示例和参数说明,请参见告警回调的请求内容是什么?

    说明
    • 配额中心的告警精度默认为15分钟,表示配额中心会在配额达到告警阈值后的大约15分钟后发送告警通知。

    • 当您的告警回调采用与钉钉机器人的Webhook方式集成时,必须先设置钉钉机器人的自定义关键字告警,再复制Webhook地址作为告警回调的URL地址。

    http://alert.aliyun.com:8080/callback

创建API速率配额告警

计费说明

API速率配额的配额告警集成的是云监控的告警能力,创建的配额告警将消耗云监控的费用额度,不同告警方式的计费如下:

  • 电话:无免费额度,您需要开通按量计费或购买资源包。更多信息,请参见按量计费资源包

  • 短信:免费额度为1000条/月,如果超过免费额度,则请您开通按量计费或购买资源包。更多信息,请参见免费额度按量计费资源包

  • 邮件和告警回调:均免费。

准备工作

  • 您需要在云监控中创建告警联系人和告警联系人组,用于接收告警消息。具体操作,请参见创建告警联系人或告警联系人组

    image

  • 如果您使用RAM用户操作API速率配额告警,RAM用户除了需要配额中心的管理权限(AliyunQuotasFullAccess)外,还需要在云监控中创建和删除配额告警的权限。

    自定义权限策略内容如下。具体操作,请参见创建自定义权限策略为RAM用户授权

    {
      "Statement": [
        {
          "Effect": "Allow",
          "Action": [
            "cms:PutMetricRuleTargets",
            "cms:PutResourceMetricRules",
            "cms:DeleteMetricRules",
            "cms:DeleteMetricRuleTargets"
          ],
          "Resource": "*"
        }
      ],
      "Version": "1"
    }

操作步骤

创建单个配额项告警

您可以为指定云产品中的单个API速率创建配额告警,即单个配额项告警。

例如:您可以为弹性伸缩的AttachDBInstances(配额为300次/60秒)创建配额告警,当实际配额大于等于250次/60秒时,通过短信和邮件给告警联系人组内的告警联系人发送告警通知。

  1. 登录配额中心控制台

  2. 在左侧导航栏,选择产品列表 > API速率配额

  3. API速率配额产品列表页面的弹性计算区域,单击弹性伸缩

  4. 单击AttachDBInstances对应操作列的创建告警

    image

  5. 告警规则创建页面,设置告警规则,然后单击确认

    表 2. API速率配额告警规则参数

    参数

    说明

    示例

    规则名称

    告警规则名称。

    为伸缩组添加RDS实例

    告警指标

    配额告警的指标。取值:

    • 配额

    • 配额用量

    • 使用率(%)

    • 剩余可用率(%)

    配额

    阈值及报警级别

    告警级别和该级别对应的阈值。

    告警级别对应的告警通知方式如下:

    • 紧急(Critical):电话+短信+邮件+告警回调。

    • 警告(Warn):短信+邮件+告警回调。

    • 普通(Info):邮件+告警回调。

    您还需要选择发送告警通知需要监控指标达到告警阈值的次数。取值:连续1个周期、连续3个周期、连续5个周期、连续10个周期、连续15个周期、连续30个周期、连续60个周期、连续70个周期、连续90个周期、连续120个周期和连续180个周期。

    您可以设置多级告警,当阈值处于不同区间时,对应不同告警级别,云监控通过不同渠道给您发送告警通知。

    • 告警级别:警告(Warn),该告警级别对应的通知方式默认为短信+邮件+告警回调

    • 阈值:>=250。

    通道沉默周期

    告警发生后未恢复正常,间隔多久重复发送一次告警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。

    某监控指标达到告警阈值时发送告警,如果监控指标在通道沉默周期内持续超过告警阈值,在通道沉默周期内不会重复发送告警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送告警通知。

    例如:当通道沉默周期选择24小时时,如果告警未恢复正常,则间隔24小时后,云监控会再次发送告警通知。

    5分钟

    生效时间

    告警规则的生效时间。告警规则仅在指定周期(星期一至星期日)的生效期内才会发送告警通知。

    • 周期:星期一~星期日

    • 时间:00:00~23:59

    告警联系人组

    发送告警的联系人组。

    应用分组的告警通知会发送给该告警联系人组中的告警联系人。告警联系人组是一组告警联系人,可以包含一个或多个告警联系人。

    关于如何创建告警联系人和告警联系人组,请参见创建告警联系人或告警联系人组

    弹性伸缩管理员

    告警回调

    公网可访问的URL,用于接收云监控通过POST请求推送的告警信息。目前仅支持HTTP协议。

    当您需要测试告警回调地址的连通性时,可以执行以下操作。

    1. 单击回调地址正后方的测试

      WebHook测试结果页面,您可以通过Webhook返回的状态码和测试结果详情对告警回调地址的连通性进行判断和排查。

      说明

      您还可以设置Webhook的语言,再次单击测试,获取对应的测试结果详情。

    2. 单击关闭

    http://alert.aliyun.com:8080/callback

    标签

    告警规则的标签。您最多可设置6组标签。

    k1,v1

    推送渠道

    告警信息的投递渠道。取值:

    • 日志服务

      如果您打开日志服务开关,当告警发生时,会将告警信息发送至日志服务的日志库。您需要设置日志服务的地域ProjectNameLogstore

      关于如何创建Project和Logstore,请参见快速入门

    • 消息服务MNS-Topic

      如果您打开消息服务MNS-Topic开关,当告警发生时,会将告警信息发送至轻量消息队列(原 MNS)的主题。您需要设置轻量消息队列(原 MNS)的地域和主题。

      关于如何创建主题,请参见创建主题

    • 函数计算

      如果您打开函数计算开关,当告警发生时,会将告警通知发送至函数计算进行格式处理。您需要设置函数计算的地域、服务和函数。

      关于如何创建服务和函数,请参见快速创建函数

    关闭开关

    恢复通知

    是否在告警恢复时发送相应的恢复通知。默认打开开关。

    打开开关

    无数据处理方法

    无监控数据时告警的处理方式。取值:

    • 不做任何处理(默认值)

    • 发送无数据告警

    • 视为恢复

    不做任何处理

创建全局配额项告警

您可以为指定云产品中的全部API速率创建配额告警,即全局配额项告警。当该云产品中任意一个API的速率配额的使用率或剩余可用率达到阈值时,会触发告警。

例如:您可以为弹性伸缩创建全局配额项告警,当任意一个API速率配额使用率大于等于80%时,通过短信和邮件给告警联系人组内的告警联系人发送告警通知。

  1. 登录配额中心控制台

  2. 在左侧导航栏,选择产品列表 > API速率配额

  3. API速率配额产品列表页面的弹性计算区域,单击弹性伸缩

  4. 单击全局告警

    image

  5. 告警规则创建页面,设置告警规则,然后单击确认

    全局告警指标仅支持使用率(%)剩余可用率(%),其余告警参数与单个配额项告警相同。更多信息,请参见通用配额告警规则参数

相关文档

您也可以直接在云监控中创建API速率配额告警,更多信息,请参见为API速率配额创建全局配额项告警配额监控

后续步骤