创建报警模板

当您拥有大量云资源时,可以使用报警模板功能,将各类云产品监控项的报警规则保存到模板中。当您创建或修改报警规则时,可以直接使用模板,无需重复定义报警规则。

背景信息

  • 报警模板需要与应用分组配合使用。您可以先创建应用分组,再创建报警模板,并将报警模板应用到应用分组,简化报警规则的创建和维护过程。关于如何创建应用分组,请参见创建应用分组

  • 当您创建报警模板时,应用限制如下:

    • 每个阿里云账号最多创建100个报警模板。

    • 每个报警模板最多包含30个监控项。

操作步骤

  1. 登录云监控控制台

  2. 在左侧导航栏,选择报警服务 > 报警模板

  3. 报警模板页面,单击创建报警模板

  4. 创建报警模板面板,先输入模板名称,再选择目标云产品。

  5. 单击目标云产品下面的添加规则,为报警模板设置规则。

    云监控支持以下报警模板:

    • 阈值报警模板

      阈值报警规则的参数说明如下表所示。

      参数

      说明

      规则名称

      阈值报警规则的名称。

      指标类型

      阈值报警规则的指标类型。取值:

      • 单指标:一条报警规则仅作用于一个监控指标。

      • 多指标:一条报警规则作用于多个监控指标。

      指标名称

      报警的监控指标名称。关于如何获取云产品的监控项,请参见云产品监控项

      说明

      指标类型选择单指标时,显示该参数。

      阈值及报警级别

      报警级别和该级别对应的阈值。

      报警级别对应的报警通知方式如下:

      • 紧急(Critical):电话+短信+邮件+WebHook。

      • 警告(Warn):短信+邮件+WebHook。

      • 普通(Info):邮件+WebHook。

      您还需要选择发送报警通知需要监控指标达到报警阈值的次数。取值:连续1个周期、连续3个周期、连续5个周期、连续10个周期、连续15个周期、连续30个周期、连续60个周期、连续70个周期、连续90个周期、连续120个周期和连续180个周期。

      您可以设置多级报警,当阈值处于不同区间时,对应不同报警级别,云监控通过不同渠道给您发送报警通知。

      说明

      指标类型选择单指标时,显示该参数。

      报警级别

      报警级别和该级别对应的报警通知方式。取值:

      • 紧急(Critical):电话+短信+邮件+WebHook

      • 警告(Warn):短信+邮件+WebHook

      • 普通(Info):邮件+WebHook

      说明

      指标类型选择多指标时,显示该参数。

      指标类型

      多个监控指标的指标类型。取值:

      • 标准创建:直接选择多个监控指标及其报警条件。

      • 表达式创建:通过表达式设置多个监控指标及其报警条件。

      说明

      指标类型选择多指标时,显示该参数。

      多指标报警描述

      多个监控指标的报警规则。

      说明

      指标类型选择多指标,且为标准创建时,显示该参数。

      多指标关系

      多个监控指标之间的关系。取值:

      • 当所有指标都符合条件时候则报警

      • 有一个满足条件就报警

      说明

      指标类型选择多指标,且为标准创建时,显示该参数。

      多指标报警表达式

      多个监控指标的报警表达式。

      关于多指标报警规则表达式的设置方法,请参见报警规则表达式说明

      说明

      指标类型选择多指标,且为表达式创建时,显示该参数。

      发出报警需要满足达到阈值的次数

      发送报警通知需要监控指标达到报警阈值的次数。取值:连续1个周期、连续3个周期、连续5个周期、连续10个周期、连续15个周期、连续30个周期、连续60个周期、连续70个周期、连续90个周期、连续120个周期和连续180个周期。

      无数据处理方法

      无监控数据时报警的处理方式。取值:

      • 不做任何处理

      • 发送无数据报警

      • 视为恢复

      标签

      报警模板的标签。报警标签会自动添加到报警内容中。

      报警回调

      公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用阈值报警回调

      当您需要测试报警回调地址的连通性时,可以执行以下操作。

      1. 单击回调地址正后方的测试

        WebHook测试面板,您可以通过Webhook返回的状态码和测试结果详情对报警回调地址的连通性进行判断和排查。

        说明

        您还可以设置Webhook的回调模板类型语言,再次单击测试,获取对应的测试结果详情。

      2. 单击关闭

    • 事件报警模板

      事件报警规则仅支持系统事件,参数说明如下表所示。

      参数

      说明

      规则名称

      事件报警规则的名称。

      事件类型

      事件报警规则的事件类型。每个云产品支持的事件类型,请参见云产品系统事件

      事件等级

      事件报警规则的事件等级。每个云产品支持的事件等级,请参见云产品系统事件

      事件名称

      事件报警规则的事件名称。每个云产品支持的事件名称,请参见云产品系统事件

      报警方式

      系统事件的报警方式。取值:

      • 报警通知:需要选择通知方式。取值:

        • Critical(电话+短信+邮件+旺旺+钉钉机器人)

        • Warning(短信+邮件+旺旺+钉钉机器人)

        • Info(邮件+旺旺+钉钉机器人)

      • 消息服务队列:事件报警投递到消息服务的指定队列。

      • 函数计算:事件报警投递到函数计算的指定函数。

      • URL回调:公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用系统事件报警回调

      • 日志服务:事件报警投递到日志服务的指定日志库。

    • 组进程报警模板

      仅云服务器ECS支持组进程报警,参数说明如下表所示。

      参数

      说明

      进程名称

      进程报警规则的名称。

      匹配规则

      进程的匹配规则。取值:

      • 组全部实例:报警设置应用于应用分组内的全部实例。当应用分组内任意实例的任意进程满足报警设置时,触发报警。

      • 满足所有规则:应用分组内实例的进程满足所有规则,触发报警。

      • 满足任意规则:应用分组内实例的进程满足任意规则,触发报警。

      动态规则匹配

      进程的动态匹配规则。报警设置可以应用于应用分组内的全部实例,也可以应用于某类实例名称。

      说明

      匹配规则满足所有规则满足任意规则时,需要设置该参数。

      进程数

      进程数量阈值。

    • 可用性监控报警模板

      仅云服务器ECS支持可用性监控报警,参数说明如下表所示。

      参数

      描述

      任务名称

      可用性监控的任务名称。

      探测类型

      待探测类型。取值:

      • HTTP(S):需要输入待探测目标的URL地址。

      • TELNET:需要输入待探测目标的IP地址。

      • PING:需要输入待探测目标的IP地址。

      探测地址

      探测类型对应的探测地址。

      匹配规则

      探测的请求方法。取值:

      • HEAD

      • GET

      • POST

      匹配响应内容

      站点探测的匹配响应方式和匹配响应信息。

      当匹配响应信息非空时,站点探测读取HTTP服务器回应Body的前64KB,从中查找匹配响应信息。匹配响应方式取值:

      • 包含匹配内容则报警

      • 不包含匹配内容则报警

      说明

      探测类型HTTP(S)时,需要设置该参数。

      状态码

      探测的状态码满足报警设置时,触发报警。

      状态码响应时间其中之一达到阈值后都会触发报警,报警会发送给应用分组的联系人组。

      响应时间

      探测的响应时间满足报警设置时,触发报警。

      状态码响应时间其中之一达到阈值后都会触发报警,报警会发送给应用分组的联系人组。

  6. 单击确定

  7. 单击确定

  8. 创建/修改报警模板完成对话框,单击确定

    说明

    如果您单击取消,则取消将当前报警模板应用到应用分组的操作。关于如何将报警模板应用到应用分组,请参见应用报警模板到应用分组

  9. 应用模板到分组对话框,设置应用分组、通道沉默周期、生效时间、报警回调和模板应用方式。

  10. 单击确定

  11. 应用模板到分组对话框,单击确定