流引擎告警

更新时间:
复制为 MD 格式

云原生多模数据库 Lindorm流引擎任务在运行中可能发生数据处理延迟或任务状态异常,需订阅相关报警以便及时响应。本文介绍如何配置和订阅流引擎告警项。

流引擎监控指标

Job 延迟告警

任务延迟报警的内核指标为:CurrentEmitEventTimeLag = EmitTime - EventTime,即Source Operator的处理时间与该记录的EventTime时间的差值。

流引擎Job 重启次数告警

任务重启次数的内核指标为:JobNumRestarts。该项阈值配置需要小于任务的最大重试次数,例如任务最大重试次数为30,此时任务重启次数告警的阈值可以为20左右。

创建流引擎告警规则

  1. 登录Lindorm管理控制台。在左上角选择实例所属的地域。在实例列表页,单击目标实例ID或者目标实例所在行操作列的管理

  2. 在左侧导航栏单击报警配置可以查看实例的告警规则。报警规则

  3. 单击创建Lindorm告警规则

  4. 创建Lindorm告警规则页面配置以下参数。

    参数

    说明

    告警名称

    告警的名称。

    检测类型

    选择静态阈值。

    Lindorm集群

    需要创建告警的Lindorm实例,即当前实例。

    告警分组

    选择Lindorm-流引擎

    告警指标

    主要有Job 延迟告警流引擎Job 重启次数告警两个。

    image