云原生多模数据库 Lindorm流引擎任务在运行中可能发生数据处理延迟或任务状态异常,需订阅相关报警以便及时响应。本文介绍如何配置和订阅流引擎告警项。
流引擎监控指标
Job 延迟告警
任务延迟报警的内核指标为:CurrentEmitEventTimeLag = EmitTime - EventTime,即Source Operator的处理时间与该记录的EventTime时间的差值。
流引擎Job 重启次数告警
任务重启次数的内核指标为:JobNumRestarts。该项阈值配置需要小于任务的最大重试次数,例如任务最大重试次数为30,此时任务重启次数告警的阈值可以为20左右。
创建流引擎告警规则
登录Lindorm管理控制台。在左上角选择实例所属的地域。在实例列表页,单击目标实例ID或者目标实例所在行操作列的管理。
在左侧导航栏单击报警配置可以查看实例的告警规则。

单击创建Lindorm告警规则。
在创建Lindorm告警规则页面配置以下参数。
参数
说明
告警名称
告警的名称。
检测类型
选择静态阈值。
Lindorm集群
需要创建告警的Lindorm实例,即当前实例。
告警分组
选择
Lindorm-流引擎。告警指标
主要有Job 延迟告警和流引擎Job 重启次数告警两个。

该文章对您有帮助吗?