云监控集中管理各云服务的系统事件和自定义事件。您可以为云服务事件设置报警规则,当异常发生时,您可以及时收到报警通知,便于快速分析并定位问题。本文为您介绍系统事件和自定义事件报警规则的创建方法。
背景信息
旧版系统事件报警规则功能已不再升级,功能会逐步下线,建议您使用新的事件订阅功能。关于如何创建事件订阅策略,请参见创建订阅策略。
云监控支持的事件类型和云产品如下表所示。
事件类型 | 说明 | 支持的云产品 |
系统事件 | 云监控为您提供各云产品系统事件的统一查询入口,使您及时得知各云产品的运行状态,并接收报警通知。 | |
自定义事件 | 您可以通过云监控的自定义事件上报接口,将目标云产品的异常事件上报到云监控,使您及时得知该云产品的运行状态,并接收报警通知。 | 云监控支持的所有云产品。 |
创建系统事件报警规则
前提条件:如果事件报警规则需要作用于指定应用分组中的实例上,则请您确保已创建应用分组,且已将目标资源添加至该应用分组。具体操作,请参见创建应用分组和添加资源至应用分组。
登录云监控控制台。
在左侧导航栏,选择 。
在事件监控页签,单击另存为报警。
在创建/修改事件报警面板,设置系统事件的报警规则参数。
表 1. 系统事件报警规则参数说明
区域
参数
说明
基本信息
报警规则名称
事件报警规则的名称。
事件报警规则
产品类型
事件报警规则的云产品类型。云监控支持的云产品,请参见云产品系统事件。
事件类型
事件报警规则的事件类型。每个云产品支持的事件类型,请参见云产品系统事件。
事件等级
事件报警规则的事件等级。每个云产品支持的事件等级,请参见云产品系统事件。
事件名称
事件报警规则的事件名称。每个云产品支持的事件名称,请参见云产品系统事件。
关键词过滤
报警规则的过滤关键词。取值:
满足包含上面任何一个关键词:当事件内容中包含任何一个关键词时,云监控会发送报警通知。
满足不包含上面任何一个关键词:当事件内容中不包含任何一个关键词时,云监控会发送报警通知。
说明关于如何查看事件内容,请参见查看系统事件。
SQL Filter
SQL过滤语句。
支持
and
和or
的条件筛选,例如:Warn and i-hp368focau7dp0hw****
,表示当事件内容中包含实例i-hp368focau7dp0hw****
和报警级别Warn
时,云监控才会发送报警通知。资源范围
事件报警规则应用的资源范围。取值:
全部资源:应用于目标云产品下的全部资源。
应用分组:应用于指定应用分组下的目标云产品。需要您选择一个应用分组。
报警方式
说明至少选择一种报警方式。
报警通知
云监控直接将事件报警通知发送给联系人组。需设置以下参数:
联系人组:事件报警规则的报警联系人组。
通知方式:事件报警的级别和通知方式。取值:
Critical(电话+短信+邮件+WebHook)
Warning(短信+邮件+WebHook)
Info(邮件+WebHook)
轻量消息队列(原 MNS)
事件报警投递到消息服务的指定队列。
函数计算
事件报警投递到函数计算的指定函数。
URL回调
公网可访问的URL,用于接收云监控通过POST或GET请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用系统事件报警回调(旧版)。
当您需要测试报警回调地址的连通性时,可以执行以下操作。
单击回调地址正后方的测试。
在WebHook测试面板,您可以通过Webhook返回的状态码和测试结果详情对报警回调地址的连通性进行判断和排查。
说明您还可以设置Webhook的回调模板类型和语言,再次单击测试,获取对应的测试结果详情。
单击关闭。
日志服务
事件报警投递到日志服务的指定日志库。
通道沉默周期
报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。
某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。
例如:当通道沉默周期选择12小时时,如果报警未恢复正常,则间隔12小时后,云监控会再次发送报警通知。
单击确定。
创建自定义事件报警规则
前提条件:如果事件报警规则需要作用于指定应用分组的实例上,则请您确保已创建应用分组,且已将资源添加至该应用分组。具体操作,请参见创建应用分组和添加资源至应用分组。
登录云监控控制台。
在左侧导航栏,选择
。在自定义事件页面,单击事件报警规则页签。
单击创建报警规则。
在创建/修改事件报警面板,设置自定义事件的报警规则参数。
表 1. 自定义事件报警规则参数说明
参数
说明
报警规则名称
事件报警规则的名称。
应用分组
只有当指定应用分组内的资源发生相关事件时,才会发送报警通知。
事件名称
自定义事件的名称。
规则描述
事件报警规则的详细信息。1~5分钟内报警累计发生的次数。
通知方式
事件报警的通知方式和级别。取值:
电话+短信+邮件+WebHook(CRITICAL)
短信+邮件+WebHook(WARN)
邮件+WebHook(INFO)
联系人组
事件报警规则的报警联系人组。
报警回调
设置URL回调地址和请求方法。填写公网可访问的URL地址,云监控会将报警信息通过POST或GET请求推送到该URL地址,目前仅支持HTTP协议。URL回调的设置方法,请参见使用阈值报警回调。
当您需要测试报警回调地址的连通性时,可以执行以下操作。
单击回调地址正后方的测试。
在WebHook测试面板,您可以通过Webhook返回的状态码和测试结果详情对报警回调地址的连通性进行判断和排查。
说明您还可以设置Webhook的回调模板类型和语言,再次单击测试,获取对应的测试结果详情。
单击关闭。
单击确定。