云数据库MongoDB产品已接入云监控平台,通过对重要的系统事件设置报警规则,让您及时得知事件的发生与进展,帮助您实时掌握事件动态。
背景信息
云监控(CloudMonitor)是针对阿里云资源和互联网应用提供监控的服务。云监控的报警服务为您提供以下两种报警通知能力,当阿里云产品发生系统异常时,您可以及时知晓发生的事件,并自动处理异常事件(例如云产品故障)。
提供通过短信、邮件、钉钉机器人的方式,对事件发生进行报警。
提供将事件分发到您的轻量消息队列、函数计算、URL回调和日志服务中,以便您根据业务场景自动化处理异常事件。
操作步骤
创建报警联系人或报警联系组,具体请参见创建报警联系人或报警联系人组。
登录MongoDB管理控制台。
根据实例类型,在左侧导航栏,单击副本集实例列表或分片集群实例列表。
在页面左上角,选择实例所在的资源组和地域。
单击目标实例ID或目标实例所在行操作列的管理。
设置事件报警。
在目标实例页面的左侧导航栏,单击报警规则。
单击设置报警规则跳转至云监控控制台。
单击创建报警规则。
在创建报警规则面板,设置以下参数。
参数
说明
产品
无需修改,默认为当前实例的类型。
资源范围
报警规则作用于指定云产品的指定资源,默认为实例。
关联资源
无需修改,默认为当前实例的实例ID。
规则描述
报警规则的主体。当监控数据满足报警条件时,触发报警规则。规则描述的设置方法如下:
单击添加规则。
在设置规则描述面板,先输入规则名称,再设置指标类型。
单指标:先选择监控指标,再为其设置阈值和报警级别。
多指标:先选择报警级别,再为两个或两个以上的监控指标设置报警条件。
智能阈值:关于智能阈值的更多信息,请参见概览和创建智能阈值报警规则。
单击确定。
说明关于如何设置复杂的报警条件,请参见报警规则表达式说明。
通道沉默周期
报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。
某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。
例如:当通道沉默周期选择12小时时,如果报警未恢复正常,则间隔12小时后,云监控会再次发送报警通知。
生效时间
报警规则的生效时间。报警规则仅在生效期内才会发送报警通知。
说明当报警规则不在生效期时,不会发送报警通知,但是报警历史记录仍然会显示在报警历史列表中。
报警联系人组
发送报警的联系人组。
应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。
关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系人组。
标签
报警规则的标签。包括标签名称和标签值。
说明您最多可设置6组标签。
报警回调
公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用阈值报警回调。
当您需要测试报警回调地址的连通性时,可以执行以下操作。
单击回调地址右侧的测试。
在WebHook测试面板,您可以通过Webhook返回的状态码和测试结果详情对报警回调地址的连通性进行判断和排查。
说明您还可以设置Webhook的回调模板类型和语言,再次单击测试,获取对应的测试结果详情。
单击关闭。
说明单击高级设置,可设置该参数。
弹性伸缩
如果您打开弹性伸缩开关,当报警发生时,会触发相应的伸缩规则。您需要设置弹性伸缩的地域、弹性伸缩组和弹性伸缩规则。
说明单击高级设置,可设置该参数。
日志服务
如果您打开日志服务开关,当报警发生时,会将报警信息发送至日志服务的日志库。您需要设置日志服务的地域、ProjectName和Logstore。
关于如何创建Project和Logstore,请参见快速入门。
说明单击高级设置,可设置该参数。
轻量消息队列(原 MNS)— topic
如果您打开轻量消息队列(原 MNS)— topic开关,当报警发生时,会将报警信息发送至轻量消息队列的主题。您需要设置轻量消息队列的地域和主题。
关于如何创建主题,请参见创建主题。
说明单击高级设置,可设置该参数。
函数计算
如果您打开函数计算开关,当报警发生时,会将报警通知发送至函数计算进行格式处理。您需要设置函数计算的地域、服务和函数。
关于如何创建服务和函数,请参见快速创建函数。
说明单击高级设置,可设置该参数。
无数据处理方法
无监控数据时报警的处理方式。取值:
不做任何处理(默认值)
发送无数据报警
视为恢复
说明单击高级设置,可设置该参数。
单击确定。
相关API
云监控产品的API接口 | 说明 |
创建或修改事件的报警规则。 |