告警事件集中为您展示离线计算、实时计算、基线监控、数据质量、数据服务功能模块的告警事件信息。本文为您介绍如何查看并处理告警事件。
查看告警事件
在Dataphin页面,单击页面右上角的告警图标,进入告警中心页面。
在告警事件页面,单击离线计算、实时计算、基线监控、数据质量、数据服务页签,查看对应模块的告警事件。不同功能模块的页签展示一致,下图以离线计算为例。
区域
描述
①筛选与搜索区
您可根据告警事件对象名称等关键字搜索告警事件;也可根据告警接收人、告警日期、告警状态、对象类型、告警原因、数据板块或所属项目筛选告警事件。
告警接收人:支持选择自己(superadmin)、所有人、告警对象的负责人、值班表、自定义用户进行筛选。
告警时间:支持选择最近一个月的告警时间。
②告警事件列表
为您展示告警时间的对象名称、最新告警时间、告警接收人、告警原因、所属项目、告警的当前状态信息。同时您可以对告警对象进行免打扰、处理告警操作。
告警原因:告警事件发生的原因,当前一个告警事件仅包含一个告警规则。不同功能的告警原因不同。
离线计算包括出错、完成、运行超时、未完成。
数据质量包括表规则异常、字段规则异常、自定义规则异常。
数据服务包括平均响应时间异常、调用次数异常、错误率异常、Offline百分比异常。
实时计算包括业务延迟过高、TPS超过范围、失败超过配置比例、数据滞留超过配置和反压持续时间超过配置。
不同的计算引擎支持的告警类型不同。
租户内的项目绑定的实时计算引擎仅包含Blink计算引擎时,不支持反压持续时间超过配置。
租户内的项目绑定的实时计算引擎仅包含开源Flink计算引擎时,不支持业务延迟过高与数据滞留超过配置。
租户内的项目绑定的实时计算引擎同时包含Blink及开源Flink计算引擎时,则都支持。
当前状态:告警对象当前的状态,包括告警完成、告警中、免打扰、告警中(静默期)。
告警完成:表示当前告警事件已完成。
告警中:告警模式设置为频繁告警,告警已开始且未达到结束的状态。
免打扰:系统支持将告警中和告警完成状态的告警事件设置为免打扰。
告警中(静默期):来源不同系统的告警自定义逻辑,例如数据服务的指标采集是秒级,但告警间隔至少是5分钟。
查看告警事件:您可单击告警对象的名称,查看告警事件详情。详情请参见查看告警事件详情。
免打扰:您可将不重要的告警对象设置为免打扰状态,详情请参见设置告警事件的状态为免打扰。
去处理告警:选择需要处理告警事件的对象,单击去处理图标或单击某个对象名称,在告警事件详情页面,单击去处理,前往该任务页面根据告警原因处理告警事件。
查看告警事件详情
在全部事件页面,单击目标对象名称,进入该告警事件详情页面。您可以查看告警对象的类型、来源系统、告警原因、告警频率、首次告警时间、最后告警时间、告警次数、告警接收人、告警方式信息,可以对该告警对象执行免打扰、处理告警操作,也可以单击相关链接前往查看更多信息。
设置告警事件的状态为免打扰
您可以将不重要的告警对象设置为免打扰状态,仅当状态为告警中或告警完成时,支持配置免打扰。
选择需处理告警事件的对象,单击免打扰图标或单击某个对象名称,在告警事件详情页面,单击免打扰。
在告警免打扰对话框,选择免打扰时长,包括全天或自定义输入时长。
单击确定,完成免打扰配置。
配置完成后,告警事件的当前状态由告警中或告警完成变更为免打扰。