文档

自定义报警配置

更新时间:

当您需要监控云原生多模数据库 Lindorm的消息引擎状态时,云原生多模数据库 Lindorm的消息引擎提供了配置自定义报警,通过配置自定义报警规则,您可以根据不同的业务需求对其状态进行不同维度的监控,以帮助您及时发现异常情况,确保业务不受影响。

前提条件

已开通消息引擎。如何开通,请参见开通消息引擎

创建告警规则

  1. 登录Lindorm管理控制台

  2. 在页面左上角,选择实例所属的地域。

  3. 实例列表页,单击目标实例ID或者目标实例所在行操作列的管理

  4. 在左侧导航栏,单击报警配置

  5. 单击创建Lindorm 告警规则

  6. 创建Lindorm 告警规则页面,配置以下配置选项。

    配置选项

    是否必填

    配置内容

    告警名称

    自定义报警名称。

    检测类型

    选择自定义PromQL

    Lindorm 集群

    选择需要配置告警的Lindorm实例ID。

    参考告警分组

    无需设置。

    参考告警指标

    无需设置。

    自定义PromQL语句

    设置告警PromQL语句规则。常用自定义PromQL语句,详情请参见常用自定义PromQL语句

    持续时间

    支持的选项如下:

    • 当告警条件满足时,直接产生告警事件。

    • 当告警条件满足且持续时间大于等于您所选择的持续时间时,才产生告警事件。

    告警等级

    根据需要设置不同告警等级。告警严重程度从默认、P4、P3、P2、P1逐级上升。

    告警内容

    收到的告警信息。您可以使用Go Template语法在告警内容中自定义告警参数变量。

    告警通知

    • 极简模式:可以快速配置通知对象通知时段重复策略

    • 普通模式:选择通知策略,如果没有通知策略,您也可以单击新建通知策略创建新的通知策略,具体操作,请参见通知策略

    说明

    配置通知对象后联系方式需要进行验证,否则可能无法收到告警通知。

    高级设置

    • 告警检查周期:配置告警的检查周期,单位:分钟。

    • 标签(labels):设置告警标签,设置的标签可用作通知策略匹配规则的选项。

    • 注释(annotations):设置告警的注释。

  7. 单击页面左下角的保存

  8. 单击页面左下角的完成

关闭或开启告警规则

  1. 登录Lindorm管理控制台

  2. 在页面左上角,选择实例所属的地域。

  3. 实例列表页,单击目标实例ID或者目标实例所在行操作列的管理

  4. 在左侧导航栏,单击报警配置

  5. Lindorm 告警列表页面的右侧操作列中,选择停止开启特定的告警规则。

常用自定义PromQL语句

常用的自定义PromQL语句示例如下。

PromQL语句

参数说明

语句说明

max(lindorm_message_groupoffsetlag{instance="${instance}"}) > 1000000

  • ${instance}:实例ID。

该实例中消息引擎最大消息堆积量超过100万。

max(lindorm_message_groupoffsetlag{instance="${instance}", group="${group}"}) > 1000000

  • ${instance}:实例ID。

  • ${group}:消费组名称。

自定义消费组(Group)的消息堆积量超过100万。

max(lindorm_message_groupoffsetlag{instance="${instance}", group="${group}", topic="${topic}"}) > 1000000

  • ${instance}:实例ID。

  • ${group}:消费组名称。

  • ${topic}:Topic名称。

自定义消费组(Group)中自定义的Topic消息堆积量超过100万。

  • 本页导读 (1)
文档反馈