当您拥有大量云资源时,可以使用报警模板功能,将各类云产品监控项的报警规则保存到模板中。当您创建或修改报警规则时,可以直接使用模板,无需重复定义报警规则。

背景信息

  • 报警模板需要与应用分组配合使用。您可以先创建应用分组,再创建报警模板,并将报警模板应用到应用分组,简化报警规则的创建和维护过程。关于如何创建应用分组,请参见创建应用分组
  • 当您创建报警模板时,应用限制如下:
    • 每个阿里云账号最多创建100个报警模板。
    • 每个报警模板最多包含30个监控项。

操作步骤

  1. 登录云监控控制台
  2. 在左侧导航栏,选择报警服务 > 报警模板
  3. 报警模板页面,单击创建报警模板
  4. 创建/修改报警模板面板,先输入模板名称,再选择目标云产品。
  5. 单击目标云产品下面的添加规则,为报警模板设置规则。
    云监控支持以下报警模板:
    • 阈值报警模板
      阈值报警规则的参数说明如下表所示。
      参数说明
      规则名称阈值报警规则的名称。
      指标类型阈值报警规则的指标类型。取值:
      • 单指标:一条报警规则仅作用于一个监控指标。
      • 多指标:一条报警规则作用于多个监控指标。
      指标名称报警的监控指标名称。关于如何获取云产品的监控项,请参见云产品监控项
      说明指标类型选择单指标时,显示该参数。
      阈值及报警级别报警规则的报警条件、报警阈值和报警级别。

      您可以设置多级报警,当阈值处于不同区间时,对应不同报警级别,云监控通过不同渠道给您发送报警通知。

      说明指标类型选择单指标时,显示该参数。
      报警级别报警级别和报警通知方式。取值:
      • 紧急(Critical)电话+短信+邮件+WebHook
      • 警告(Warn)短信+邮件+WebHook
      • 普通(Info)邮件+WebHook
      说明指标类型选择多指标时,显示该参数。
      指标类型多个监控指标的指标类型。取值:
      • 标准创建:直接选择多个监控指标及其报警条件。
      • 表达式创建:通过表达式设置多个监控指标及其报警条件。
      说明指标类型选择多指标时,显示该参数。
      多指标报警描述多个监控指标的报警规则。
      说明指标类型选择多指标,且为标准创建时,显示该参数。
      监控图表预览监控指标的监控图表预览效果。

      监控图表预览开关默认关闭。

      说明指标类型选择多指标,且为标准创建时,显示该参数。
      多指标关系多个监控指标之间的关系。取值:
      • 当所有指标都符合条件时候则报警
      • 有一个满足条件就报警
      说明指标类型选择多指标,且为标准创建时,显示该参数。
      多指标报警表达式多个监控指标的报警表达式。

      关于多指标报警规则表达式的设置方法,请参见报警规则表达式说明

      说明指标类型选择多指标,且为表达式创建时,显示该参数。
      发出报警需要满足达到阈值的次数发送报警通知需要监控指标达到报警阈值的次数。取值:连续1个周期、连续3个周期、连续5个周期、连续10个周期、连续15个周期、连续30个周期、连续60个周期、连续70个周期、连续90个周期、连续120个周期和连续180个周期。
      无数据报警处理方法无监控数据时报警的处理方式。取值:
      • 不做任何处理(默认值)
      • 发送无数据报警
      • 视为恢复
    • 事件报警模板
      事件报警规则仅支持系统事件,参数说明如下表所示。
      参数说明
      规则名称事件报警规则的名称。
      事件类型事件报警规则的事件类型。每个云产品支持的事件类型,请参见云产品系统事件
      事件等级事件报警规则的事件等级。每个云产品支持的事件等级,请参见云产品系统事件
      事件名称事件报警规则的事件名称。每个云产品支持的事件名称,请参见云产品系统事件
      消息服务队列事件报警投递到消息服务的指定队列。
      函数计算事件报警投递到函数计算的指定函数。
      URL回调

      公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用系统事件报警回调

      当您需要测试报警回调地址的连通性时,可以执行以下操作。
      1. 单击回调地址正后方的测试
        WebHook测试面板,您可以通过Webhook返回的状态码和测试结果详情对报警回调地址的连通性进行判断和排查。
        说明 您还可以设置Webhook的回调模板类型语言,再次单击测试,获取对应的测试结果详情。
      2. 单击关闭
      日志服务事件报警投递到日志服务的指定日志库。
    • 组进程报警模板
      仅云服务器ECS支持组进程报警,参数说明如下表所示。
      参数说明
      进程名称进程报警规则的名称。
      匹配规则进程的匹配规则。取值:
      • 组全部实例:报警设置应用于应用分组内的全部实例。当应用分组内任意实例的任意进程满足报警设置时,触发报警。
      • 满足所有规则:应用分组内实例的进程满足所有规则,触发报警。
      • 满足任意规则:应用分组内实例的进程满足任意规则,触发报警。
      动态规则匹配进程的动态匹配规则。报警设置可以应用于应用分组内的全部实例,也可以应用于某类实例名称。
      说明匹配规则满足所有规则满足任意规则时,需要设置该参数。
      进程数进程数量。
    • 可用性监控报警模板
      仅云服务器ECS支持可用性监控报警,参数说明如下表所示。
      参数描述
      任务名称可用性监控的任务名称。
      探测源待探测的实例ID。默认选中全部,且不能修改。
      探测类型待探测类型。取值:
      • HTTP(S):需要输入待探测目标的URL地址。
      • TELNET:需要输入待探测目标的IP地址。
      • PING:需要输入待探测目标的IP地址。
      探测地址探测类型对应的探测地址。
      匹配规则探测的请求方法。取值:
      • HEAD
      • GET
      • POST
      提交内容站点探测时POST的请求内容。

      提交内容格式:parameter1=value1&parameter2=value2,仅支持英文。

      探测类型HTTP(S),且请求方法POST时,需要设置该参数。

      匹配响应内容站点探测的匹配响应方式和匹配响应信息。
      当匹配响应信息非空时,站点探测读取HTTP服务器回应Body的前64KB,从中查找匹配响应信息。匹配响应方式取值:
      • 包含匹配内容则报警
      • 不包含匹配内容则报警
      说明探测类型HTTP(S)时,需要设置该参数。
      状态码

      探测的状态码满足报警设置时,触发报警。

      状态码响应时间其中之一达到阈值后都会触发报警,报警会发送给应用分组的联系人组。

      响应时间

      探测的响应时间满足报警设置时,触发报警。

      状态码响应时间其中之一达到阈值后都会触发报警,报警会发送给应用分组的联系人组。

  6. 单击确定
  7. 单击确定
  8. 创建/修改报警模板完成对话框,单击确定
    说明 如果您单击取消,则取消将当前报警模板应用到应用分组的操作。关于如何将报警模板应用到应用分组,请参见应用报警模板到应用分组
  9. 应用模板到分组对话框,设置应用分组、通道沉默周期、生效时间、报警回调和模板应用方式。
  10. 单击确定
  11. 应用模板到分组对话框,单击确定