文档

管理系统事件报警规则(旧版)

更新时间:

云监控集中管理各云产品的系统事件和自定义事件。您可以为云产品的系统事件设置报警规则,当异常发生时,您可以及时收到报警通知,便于快速分析并定位问题。

背景信息

说明

旧版系统事件报警规则功能已不再升级,功能会逐步下线,建议您使用新的事件订阅功能。关于如何创建事件订阅策略,请参见创建订阅策略

云监控支持的事件类型和云产品如下表所示。

事件类型

说明

支持的云产品

系统事件

云监控为您提供各云产品系统事件的统一查询入口,使您及时得知各云产品的运行状态,并接收报警通知。

支持的云产品和系统事件

自定义事件

您可以通过云监控的自定义事件上报接口,将目标云产品的异常事件上报到云监控,使您及时得知该云产品的运行状态,并接收报警通知。

云监控支持的所有云产品。

创建系统事件报警规则

前提条件:如果事件报警规则需要作用于指定应用分组中的实例上,则请您确保已创建应用分组,且已将目标资源添加至该应用分组。具体操作,请参见创建应用分组添加资源至应用分组

  1. 登录云监控控制台

  2. 在左侧导航栏,选择事件中心 > 系统事件

  3. 事件监控页签,单击另存为报警

  4. 创建/修改事件报警面板,设置系统事件的报警规则参数。

    表 1. 系统事件报警规则参数说明

    区域

    参数

    说明

    基本信息

    报警规则名称

    事件报警规则的名称。

    事件报警规则

    产品类型

    事件报警规则的云产品类型。云监控支持的云产品,请参见云产品系统事件

    事件类型

    事件报警规则的事件类型。每个云产品支持的事件类型,请参见云产品系统事件

    事件等级

    事件报警规则的事件等级。每个云产品支持的事件等级,请参见云产品系统事件

    事件名称

    事件报警规则的事件名称。每个云产品支持的事件名称,请参见云产品系统事件

    关键词过滤

    报警规则的过滤关键词。取值:

    • 满足包含上面任何一个关键词:当事件内容中包含任何一个关键词时,云监控会发送报警通知。

    • 满足不包含上面任何一个关键词:当事件内容中不包含任何一个关键词时,云监控会发送报警通知。

    说明

    关于如何查看事件内容,请参见查看系统事件

    SQL Filter

    SQL过滤语句。

    支持andor的条件筛选,例如:Warn and i-hp368focau7dp0hw****,表示当事件内容中包含实例i-hp368focau7dp0hw****和报警级别Warn时,云监控才会发送报警通知。

    资源范围

    事件报警规则应用的资源范围。取值:

    • 全部资源:应用于目标云产品下的全部资源。

    • 应用分组:应用于指定应用分组下的目标云产品。需要您选择一个应用分组。

    报警方式

    说明

    至少选择一种报警方式。

    报警通知

    云监控直接将事件报警通知发送给联系人组。需设置以下参数:

    • 联系人组:事件报警规则的报警联系人组。

    • 通知方式:事件报警的级别和通知方式。取值:

      • Critical(电话+短信+邮件+WebHook)

      • Warning(短信+邮件+WebHook)

      • Info(邮件+WebHook)

    消息服务队列

    事件报警投递到消息服务的指定队列。

    函数计算

    事件报警投递到函数计算的指定函数。

    URL回调

    公网可访问的URL,用于接收云监控通过POST或GET请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用系统事件报警回调(旧版)

    当您需要测试报警回调地址的连通性时,可以执行以下操作。

    1. 单击回调地址正后方的测试

      WebHook测试面板,您可以通过Webhook返回的状态码和测试结果详情对报警回调地址的连通性进行判断和排查。

      说明

      您还可以设置Webhook的回调模板类型语言,再次单击测试,获取对应的测试结果详情。

    2. 单击关闭

    日志服务

    事件报警投递到日志服务的指定日志库。

    通道沉默周期

    报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。

    某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。

    例如:当通道沉默周期选择12小时时,如果报警未恢复正常,则间隔12小时后,云监控会再次发送报警通知。

  5. 单击确定

调试系统事件报警规则

创建系统事件报警规则后,您可以使用系统事件的调试功能,验证系统事件报警规则中设置的消息服务队列、函数计算、URL回调和日志服务是否能正常被触发。

使用限制:您只能调试系统事件的报警规则,且该规则必须关联指定的云服务和事件名称。

  1. 登录云监控控制台

  2. 在左侧导航栏,选择事件中心 > 系统事件

  3. 事件监控页签,单击右侧的旧版事件报警规则

  4. 先单击目标报警规则对应操作列的更多图标,然后单击调试

  5. 创建事件调试面板,选择待调试事件。

  6. 内容(JSON格式)区域,显示该事件内容,您可以根据实际环境修改其实例ID等信息。

  7. 单击确定

    云监控自动给报警联系人发送一条报警测试通知。

修改系统事件报警规则

  1. 登录云监控控制台

  2. 在左侧导航栏,选择事件中心 > 系统事件

  3. 事件监控页签,单击右侧的旧版事件报警规则

  4. 单击目标报警规则对应操作列的修改

  5. 创建/修改事件报警面板,设置系统事件的报警规则参数。

    关于如何设置系统事件报警规则的相关参数,请参见系统事件报警规则参数说明

  6. 单击确定

禁用系统事件报警规则

新创建的系统事件报警规则默认的启用状态已启用。当您暂时不需要接收某条系统事件的报警通知时,可以对其执行禁用操作。启用系统事件报警规则后,自动恢复报警通知。

  1. 登录云监控控制台

  2. 在左侧导航栏,选择事件中心 > 系统事件

  3. 事件监控页签,单击右侧的旧版事件报警规则

  4. 禁用系统事件报警规则。

    • 单个禁用

      1. 单击目标报警规则对应操作列的禁用

      2. 单击确定

    • 批量禁用

      1. 先单击目标报警规则前面的复选框,然后单击左下角的禁用

      2. 单击确定

启用系统事件报警规则

当某条系统事件报警规则的启用状态已禁用时,您可以对其执行启用操作。

  1. 登录云监控控制台

  2. 在左侧导航栏,选择事件中心 > 系统事件

  3. 事件监控页签,单击右侧的旧版事件报警规则

  4. 启用系统事件报警规则。

    • 单个启用

      1. 单击目标报警规则对应操作列的启用

      2. 单击确定

    • 批量启用

      1. 先单击目标报警规则前面的复选框,然后单击左下角的启用

      2. 单击确定

删除系统事件报警规则

删除目标系统事件的报警规则后,该系统事件不再给您发送报警通知。

  1. 登录云监控控制台

  2. 在左侧导航栏,选择事件中心 > 系统事件

  3. 事件监控页签,单击右侧的旧版事件报警规则

  4. 删除系统事件报警规则。

    • 单个删除

      1. 单击目标报警规则对应操作列的删除

      2. 单击确定

    • 批量删除

      1. 先单击目标报警规则前面的复选框,然后单击左下角的删除

      2. 单击确定

相关文档