当您拥有大量云资源时,可以使用报警模板功能,将各类云服务监控项的报警规则保存到模板中。当您创建或修改报警规则时,可以直接使用模板,无需重复定义报警规则。

背景信息

  • 报警模板需要与应用分组配合使用。您可以先创建应用分组,再创建报警模板,并将报警模板应用到应用分组,简化报警规则的创建和维护过程。关于如何创建应用分组,请参见创建应用分组
  • 当您创建报警模板时,应用限制如下:
    • 每个阿里云账号最多创建100个报警模板。
    • 每个报警模板最多包含30个监控项。

操作步骤

  1. 登录云监控控制台
  2. 在左侧导航栏,选择报警服务 > 报警模板
  3. 报警模板页面,单击创建报警模板
  4. (可选)在创建/修改报警模板面板,先输入模板名称,再单击选择产品,选择目标云服务。
    云监控默认显示云服务器ECS。当您为云服务器ECS添加规则时,无需执行本操作。
  5. 单击目标云服务下面的添加规则,为报警模板设置规则。
    云监控支持以下报警模板:
    • 阈值报警模板
      阈值报警规则支持的阈值类型如下表所示,且两者二选一。
      阈值类型 说明 注意事项
      静态阈值 您可以设置固定阈值,云监控根据该阈值,给您发送报警通知。 无。
      动态阈值 动态阈值是云监控将历史监控数据通过智能算法自动计算所得,再根据报警敏感度提供实时的动态阈值。

      当监控数据周期性变化时,为了减少误报报警,您可以创建动态阈值报警规则,云监控根据动态阈值,给您发送报警通知。

      • 每个阿里云账号最多可以创建5个动态阈值报警规则。
      • 动态阈值报警规则只支持单个资源,不支持全部资源。
      • 创建动态阈值报警规则1小时~3小时后,该规则生效。
      静态阈值和动态阈值的参数说明如下表所示。
      • 静态阈值
        参数 说明
        规则名称 阈值报警规则的名称。
        指标名称 监控项的名称。关于如何获取云服务的监控项,请参见云服务监控项
        阈值及报警级别 报警规则的报警条件、报警阈值和报警级别。

        您可以设置多级报警,当阈值处于不同区间时,对应不同报警级别,云监控通过不同渠道给您发送报警通知。

      • 动态阈值
        参数 说明
        规则名称 阈值报警规则的名称。
        指标名称 监控项的名称。关于如何获取云服务的监控项,请参见云服务监控项
        参数 报警规则的主体。当监控数据满足指定报警条件时,触发报警规则。
        告警敏感度 报警的敏感度。取值:低(默认值)、中、高。

        报警敏感度越高,报警越频繁。

        默认使用的历史数据(天) 云监控自动计算动态阈值采用历史数据的天数。单位:天。取值范围:3~14。默认值:14
        例如:默认使用的历史数据14,在创建动态阈值报警规则之前,您必须确保目标监控指标在14天内有监控数据;如果任意一天无监控数据,则无法计算出动态阈值,云监控不会给您发送报警通知。
        说明 默认使用的历史数据默认为14天,您可以单击告警配置进行修改。
        报警级别
        • 电话+短信+邮件+钉钉机器人
        • 短信+邮件+钉钉机器人
        • 邮件+钉钉机器人
    • 事件报警模板
      事件报警规则仅支持系统事件,参数说明如下表所示。
      参数 说明
      规则名称 事件报警规则的名称。
      事件类型 事件报警规则的事件类型。每个云服务支持的事件类型,请参见云服务系统事件
      事件等级 事件报警规则的事件等级。每个云服务支持的事件等级,请参见云服务系统事件
      事件名称 事件报警规则的事件名称。每个云服务支持的事件名称,请参见云服务系统事件
      消息服务队列 事件报警投递到消息服务的指定队列。
      函数计算 事件报警投递到函数计算的指定函数。
      URL回调 设置URL回调地址和请求方法。填写公网可访问的URL,云监控会将报警信息通过POST或GET请求推送到该地URL,目前仅支持HTTP协议。关于如何设置URL回调,请参见使用系统事件报警回调
      日志服务 事件报警投递到日志服务的指定日志库。
    • 组进程报警模板
      仅云服务器ECS支持组进程报警,参数说明如下表所示。
      参数 说明
      进程名称 进程报警规则的名称。
      匹配规则 进程的匹配规则。取值:
      • 组全部实例:报警设置应用于应用分组内的全部实例。当应用分组内任意实例的任意进程满足报警设置时,触发报警。
      • 满足所有规则:应用分组内实例的进程满足所有规则,触发报警。
      • 满足任意规则应用分组内实例的进程满足任意规则,触发报警。
      动态规则匹配 进程的动态匹配规则。报警设置可以应用于应用分组内的全部实例,也可以应用于某类实例名称。

      匹配规则满足所有规则满足任意规则时,需要设置该参数。

      进程数 进程数量。
    • 可用性监控报警模板
      仅云服务器ECS支持可用性监控报警,参数说明如下表所示。
      参数 描述
      任务名称 可用性监控的任务名称。
      探测源 待探测的实例ID。默认选中全部,且不能修改。
      探测类型 待探测类型。取值:
      • HTTP(S):需要输入待探测目标的URL地址。
      • TELNET:需要输入待探测目标的IP地址。
      • PING:需要输入待探测目标的IP地址。
      请求方法 探测的请求方法。取值:
      • HEAD
      • GET
      • POST
      提交内容 站点探测时POST的请求内容。

      提交内容格式:parameter1=value1&parameter2=value2,仅支持英文。

      探测类型HTTP(S),且请求方法POST时,需要设置该参数。

      匹配响应内容 站点探测的匹配响应方式和匹配响应信息。
      当匹配响应信息非空时,站点探测读取HTTP服务器回应Body的前64KB,从中查找匹配响应信息。匹配响应方式取值:
      • 包含匹配内容则报警
      • 不包含匹配内容则报警

      探测类型HTTP(S)时,需要设置该参数。

      状态码

      探测的状态码满足报警设置时,触发报警。

      探测类型HTTP(S)TELNET时,需要设置该参数。

      状态码响应时间其中之一达到阈值后都会触发报警,报警会发送给应用分组的联系人组。

      响应时间

      探测的响应时间满足报警设置时,触发报警。

      探测类型HTTP(S)TELNET时,需要设置该参数。

      状态码响应时间其中之一达到阈值后都会触发报警,报警会发送给应用分组的联系人组。

      丢包率

      探测的丢包率满足报警设置时,触发报警。

      探测类型PING时,需要设置该参数。

  6. 单击确定
  7. 单击确定
  8. 创建/修改报警模板完成对话框,单击确定
    说明 如果您单击取消,则取消将当前报警模板应用到应用分组的操作。关于如何将报警模板应用到应用分组,请参见应用报警模板到应用分组
  9. 应用模板到分组对话框,选择应用分组、通道沉默周期、生效时间、报警回调和模板应用方式。
  10. 单击确认
  11. 应用模板到分组对话框,单击确认