报警服务

更新时间: 2023-08-29 14:41:34

您可以通过设置报警规则来定义报警系统如何检查监控数据,并在监控数据满足报警规则时发送报警通知。如果您对重要监控指标设置报警规则,则可在第一时间得知指标异常,并迅速处理故障。

背景信息

  • 报警规则存在沉默周期,当您的监控指标发生异常时,为避免报警风暴,在通道沉默周期(例如:24小时)内云监控只会发送一次报警通知。

  • 云监控默认将您的阿里云账号添加为报警联系人,并自动为其创建报警联系组。

创建报警联系人

同一个报警联系人,可以加入多个报警联系组。

  1. 登录云监控控制台
  2. 在左侧导航栏,选择报警服务 > 报警联系人

  3. 报警联系人页签,单击创建联系人

  4. 设置报警联系人面板,填写报警联系人的姓名、手机号码、邮箱和Webhook地址报警通知信息语言保持默认值自动

    说明

    自动表示云监控根据当前阿里云账号注册时的语言,自动适配报警通知信息的语言。

  5. (可选)测试Webhook地址的连通性。

    当您需要测试Webhook地址的连通性时,可以执行本操作。

    1. 单击Webhook地址正后方的测试

      WebHook测试面板,您可以通过Webhook返回的状态码和测试结果详情对Webhook地址的连通性进行判断和排查。

      说明

      您还可以设置Webhook的回调模板类型语言,再次单击测试,获取对应的测试结果详情。

    2. 单击关闭

  6. 信息验证无误后,单击确认

  7. (可选)报警联系人邮箱和手机号码激活。

    如果您设置了报警联系人的邮箱和手机号码,默认处于等待激活状态。报警联系人需要根据邮件和短消息中的激活链接,在24小时内进行激活,否则无法收到报警通知。激活后,您可以在报警联系人列表中看到目标报警联系人的手机号码和邮箱。

创建报警联系组

报警联系组是一组报警联系人,可以包含一个或多个报警联系人。

  1. 登录云监控控制台
  2. 在左侧导航栏,选择报警服务 > 报警联系人

  3. 单击报警联系组页签。

  4. 报警联系组页签,单击新建联系组

  5. 新建联系组面板,填写报警联系组的组名,并选择报警联系人。

  6. 单击确认

批量添加报警联系人到报警联系组

  1. 登录云监控控制台
  2. 在左侧导航栏,选择报警服务 > 报警联系人

  3. 报警联系人页签,单击目标报警联系人前面的复选框。

  4. 单击添加到报警联系组

  5. 添加到报警联系组对话框,单击目标报警联系组。

  6. 单击确定

创建报警规则

  1. 登录云监控控制台
  2. 在左侧导航栏,选择报警服务 > 报警规则

  3. 报警规则页面,单击创建报警规则

  4. 创建报警规则面板,设置报警规则相关参数。

    参数

    说明

    产品

    云监控可管理的云产品名称。例如:云数据库RDS版。

    资源范围

    报警规则作用的资源范围。取值:

    • 全部资源:报警规则作用于指定云产品的全部资源上,对于新加入的资源生效。

    • 应用分组:报警规则作用于指定云产品的指定应用分组内的全部资源上,对于新加入的资源生效。

    • 实例:报警规则作用于指定云产品的指定资源上。

    规则描述

    报警规则的主体。当监控数据满足报警条件时,触发报警规则。规则描述的设置方法如下:

    1. 单击添加规则

    2. 添加规则描述面板,设置规则名称、监控指标类型、监控指标、阈值、报警级别和报警方式等。

    3. 单击确定

    说明

    关于如何设置复杂的报警条件,请参见报警规则表达式说明

    通道沉默周期

    报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。

    某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。

    例如:当通道沉默周期选择12小时时,如果报警未恢复正常,则间隔12小时后,云监控会再次发送报警通知。

    生效时间

    报警规则的生效时间。报警规则仅在生效期内才会发送报警通知。

    说明

    当报警规则不在生效期时,不会发送报警通知,但是报警历史记录仍然会显示在报警历史列表中。

    报警联系人组

    发送报警的联系人组。

    应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。

    关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系组

    标签

    报警规则的标签。包括标签名称和标签值。

    说明

    您最多可设置6组标签。

    报警回调

    公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用阈值报警回调

    当您需要测试报警回调地址的连通性时,可以执行以下操作。

    1. 单击回调地址正后方的测试

      WebHook测试面板,您可以通过Webhook返回的状态码和测试结果详情对报警回调地址的连通性进行判断和排查。

      说明

      您还可以设置Webhook的回调模板类型语言,再次单击测试,获取对应的测试结果详情。

    2. 单击关闭

    说明

    单击高级设置,可设置该参数。

    弹性伸缩

    如果您打开弹性伸缩开关,当报警发生时,会触发相应的伸缩规则。您需要设置弹性伸缩的地域弹性伸缩组弹性伸缩规则

    说明

    单击高级设置,可设置该参数。

    日志服务

    如果您打开日志服务开关,当报警发生时,会将报警信息发送至日志服务的日志库。您需要设置日志服务的地域ProjectNameLogstore

    关于如何创建Project和Logstore,请参见快速入门

    说明

    单击高级设置,可设置该参数。

    消息服务MNS-Topic

    如果您打开消息服务MNS-Topic开关,当报警发生时,会将报警信息发送至消息服务的主题。您需要设置消息服务的地域和主题。

    关于如何创建主题,请参见创建主题

    说明

    单击高级设置,可设置该参数。

    函数计算

    如果您打开函数计算开关,当报警发生时,会将报警通知发送至函数计算进行格式处理。您需要设置函数计算的地域、服务和函数。

    关于如何创建服务和函数,请参见快速创建函数

    说明

    单击高级设置,可设置该参数。

    无数据处理方法

    无监控数据时报警的处理方式。取值:

    • 不做任何处理(默认值)

    • 发送无数据报警

    • 视为恢复

    说明

    单击高级设置,可设置该参数。

阿里云首页 云监控 相关技术圈