文档

为子实例设置同步延迟的监控报警

更新时间:

您可以对全球多活子实例设置同步延迟报警。当监控指标达到报警条件,云监控自动发送报警通知,告知您数据指标发生异常,帮助您及时定位、处理故障。

背景信息

云数据库 Redis 版全球多活实例已接入云监控平台,云监控是针对阿里云资源和互联网应用进行监控的服务,可以帮助您提升系统服务可用时长,降低企业IT运维监控成本。

操作步骤

  1. 登录云监控控制台

  2. 在左侧导航栏,选择报警服务 > 报警规则

  3. 报警规则页面,单击创建报警规则

  4. 创建报警规则页面,设置报警规则相关参数。

    配置

    说明

    产品

    根据分布式实例的架构,按需选择Redis/Tair内存型(标准版)Redis/Tair内存型(集群版)Redis/Tair内存型(读写分离版)

    说明

    您可以在文本框中输入Redis来过滤,快速查找到目标产品。

    资源范围

    报警规则作用的资源范围。取值:

    • 全部资源:报警规则作用于指定云产品的全部资源上,对于新加入的资源生效。

    • 应用分组:报警规则作用于指定云产品的指定应用分组内的全部资源上,对于新加入的资源生效。

    • 实例:报警规则作用于指定云产品的指定资源上。

    规则描述

    报警规则的主体。当监控数据满足报警条件时,触发报警规则。规则描述的设置方法如下:

    1. 单击添加规则

    2. 设置规则描述面板,设置规则名称、监控指标类型、监控指标、阈值、报警级别和报警方式等。

      本示例中,云监控会实时监控5分钟内Node > 多活同步时延监控项的平均值是否大于60秒,如果检查结果符合设置的规则,则触发报警。

    3. 单击确定

    说明

    关于如何设置复杂的报警条件,请参见报警规则表达式说明

    通道沉默周期

    报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。

    某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。

    生效时间

    报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。

    报警联系人组

    发送报警的联系人组。

    应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。

    关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系人组

    说明

    其余参数,可保持默认,更多信息请参见创建报警规则

  5. 单击确认

  • 本页导读 (1)