当您拥有大量云资源时,可以使用报警模板功能,将各类云产品监控项的报警规则保存到模板中。当您创建或修改报警规则时,可以直接使用模板,无需重复定义报警规则。

背景信息

  • 报警模板需要与应用分组配合使用。您可以先创建应用分组,再创建报警模板,并将报警模板应用到应用分组,简化报警规则的创建和维护过程。关于如何创建应用分组,请参见创建应用分组
  • 当您创建报警模板时,应用限制如下:
    • 每个阿里云账号最多创建100个报警模板。
    • 每个报警模板最多包含30个监控项。

操作步骤

  1. 登录云监控控制台
  2. 在左侧导航栏,选择报警服务 > 报警模板
  3. 报警模板页面,单击创建报警模板
  4. 创建/修改报警模板面板,先输入模板名称,再选择目标云产品。
  5. 单击目标云产品下面的添加规则,为报警模板设置规则。
    云监控支持以下报警模板:
    • 阈值报警模板
      阈值报警规则的参数说明如下表所示。
      参数 说明
      规则名称 阈值报警规则的名称。
      指标类型 阈值报警规则的指标类型。取值:
      • 单指标:一条报警规则仅作用于一个监控指标。
      • 多指标:一条报警规则作用于多个监控指标。
      指标名称 报警的监控指标名称。关于如何获取云产品的监控项,请参见云产品监控项
      说明指标类型选择单指标时,显示该参数。
      阈值及报警级别 报警规则的报警条件、报警阈值和报警级别。

      您可以设置多级报警,当阈值处于不同区间时,对应不同报警级别,云监控通过不同渠道给您发送报警通知。

      说明指标类型选择单指标时,显示该参数。
      报警级别 报警级别和报警通知方式。取值:
      • 紧急(Critical)电话+短信+邮件+钉钉机器人
      • 警告(Warn)短信+邮件+钉钉机器人
      • 普通(Info)邮件+钉钉机器人
      说明指标类型选择多指标时,显示该参数。
      指标类型 多个监控指标的指标类型。取值:
      • 标准创建:直接选择多个监控指标及其报警条件。
      • 表达式创建:通过表达式设置多个监控指标及其报警条件。
      说明指标类型选择多指标时,显示该参数。
      多指标报警描述 多个监控指标的报警规则。
      说明指标类型选择多指标,且为标准创建时,显示该参数。
      监控图表预览 监控指标的监控图表预览效果。

      监控图表预览开关默认关闭。

      说明指标类型选择多指标,且为标准创建时,显示该参数。
      多指标关系 多个监控指标之间的关系。取值:
      • 当所有指标都符合条件时候则报警
      • 有一个满足条件就报警
      说明指标类型选择多指标,且为标准创建时,显示该参数。
      多指标报警表达式 多个监控指标的报警表达式。
      说明指标类型选择多指标,且为表达式创建时,显示该参数。
      发出报警需要满足达到阈值的次数 发送报警通知需要监控指标达到报警阈值的次数。取值:连续1个周期、连续3个周期、连续5个周期、连续10个周期、连续15个周期、连续30个周期、连续60个周期、连续70个周期、连续90个周期、连续120个周期和连续180个周期。
      无数据报警处理方法 无监控数据时报警的处理方式。取值:
      • 不做任何处理(默认值)
      • 发送无数据报警
      • 视为正常
    • 事件报警模板
      事件报警规则仅支持系统事件,参数说明如下表所示。
      参数 说明
      规则名称 事件报警规则的名称。
      事件类型 事件报警规则的事件类型。每个云产品支持的事件类型,请参见云产品系统事件
      事件等级 事件报警规则的事件等级。每个云产品支持的事件等级,请参见云产品系统事件
      事件名称 事件报警规则的事件名称。每个云产品支持的事件名称,请参见云产品系统事件
      消息服务队列 事件报警投递到消息服务的指定队列。
      函数计算 事件报警投递到函数计算的指定函数。
      URL回调 设置URL回调地址和请求方法。填写公网可访问的URL,云监控会将报警信息通过POST或GET请求推送到该地URL,目前仅支持HTTP协议。关于如何设置URL回调,请参见使用系统事件报警回调
      日志服务 事件报警投递到日志服务的指定日志库。
    • 组进程报警模板
      仅云服务器ECS支持组进程报警,参数说明如下表所示。
      参数 说明
      进程名称 进程报警规则的名称。
      匹配规则 进程的匹配规则。取值:
      • 组全部实例:报警设置应用于应用分组内的全部实例。当应用分组内任意实例的任意进程满足报警设置时,触发报警。
      • 满足所有规则:应用分组内实例的进程满足所有规则,触发报警。
      • 满足任意规则:应用分组内实例的进程满足任意规则,触发报警。
      动态规则匹配 进程的动态匹配规则。报警设置可以应用于应用分组内的全部实例,也可以应用于某类实例名称。
      说明匹配规则满足所有规则满足任意规则时,需要设置该参数。
      进程数 进程数量。
    • 可用性监控报警模板
      仅云服务器ECS支持可用性监控报警,参数说明如下表所示。
      参数 描述
      任务名称 可用性监控的任务名称。
      探测源 待探测的实例ID。默认选中全部,且不能修改。
      探测类型 待探测类型。取值:
      • HTTP(S):需要输入待探测目标的URL地址。
      • TELNET:需要输入待探测目标的IP地址。
      • PING:需要输入待探测目标的IP地址。
      探测地址 探测类型对应的探测地址。
      匹配规则 探测的请求方法。取值:
      • HEAD
      • GET
      • POST
      提交内容 站点探测时POST的请求内容。

      提交内容格式:parameter1=value1&parameter2=value2,仅支持英文。

      探测类型HTTP(S),且请求方法POST时,需要设置该参数。

      匹配响应内容 站点探测的匹配响应方式和匹配响应信息。
      当匹配响应信息非空时,站点探测读取HTTP服务器回应Body的前64KB,从中查找匹配响应信息。匹配响应方式取值:
      • 包含匹配内容则报警
      • 不包含匹配内容则报警
      说明探测类型HTTP(S)时,需要设置该参数。
      状态码

      探测的状态码满足报警设置时,触发报警。

      状态码响应时间其中之一达到阈值后都会触发报警,报警会发送给应用分组的联系人组。

      响应时间

      探测的响应时间满足报警设置时,触发报警。

      状态码响应时间其中之一达到阈值后都会触发报警,报警会发送给应用分组的联系人组。

  6. 单击确定
  7. 单击确定
  8. 创建/修改报警模板完成对话框,单击确定
    说明 如果您单击取消,则取消将当前报警模板应用到应用分组的操作。关于如何将报警模板应用到应用分组,请参见应用报警模板到应用分组
  9. 应用模板到分组对话框,设置应用分组、通道沉默周期、生效时间、报警回调和模板应用方式。
  10. 单击确定
  11. 应用模板到分组对话框,单击确定