告警事件

告警事件集中为您展示离线计算、实时计算、基线监控、数据质量、数据服务功能模块的告警事件信息。本文为您介绍如何查看并处理告警事件。

查看告警事件

  1. 在Dataphin页面,单击页面右上角的告警ddd图标,进入告警中心页面。 

    image

  2. 告警事件页面,单击离线计算实时计算基线监控数据质量数据服务页签,查看对应模块的告警事件。不同功能模块的页签展示一致,下图以离线计算为例。

    image

    区域

    描述

    ①筛选与搜索区

    您可根据告警事件对象名称等关键字搜索告警事件;也可根据告警接收人告警日期告警状态对象类型告警原因数据板块所属项目筛选告警事件。

    • 告警接收人:支持选择自己(superadmin)、所有人、告警对象的负责人、值班表、自定义用户进行筛选。

    • 告警时间:支持选择最近一个月的告警时间。

    ②告警事件列表

    为您展示告警时间的对象名称、最新告警时间、告警接收人、告警原因、所属项目、告警的当前状态信息。同时您可以对告警对象进行免打扰处理告警操作。

    • 告警原因:告警事件发生的原因,当前一个告警事件仅包含一个告警规则。不同功能的告警原因不同。

      • 离线计算包括出错完成运行超时未完成

      • 数据质量包括表规则异常字段规则异常自定义规则异常

      • 数据服务包括平均响应时间异常调用次数异常错误率异常Offline百分比异常

      • 实时计算包括业务延迟过高TPS超过范围失败超过配置比例数据滞留超过配置反压持续时间超过配置

        不同的计算引擎支持的告警类型不同。

        • 租户内的项目绑定的实时计算引擎仅包含Blink计算引擎时,不支持反压持续时间超过配置

        • 租户内的项目绑定的实时计算引擎仅包含开源Flink计算引擎时,不支持业务延迟过高数据滞留超过配置

        • 租户内的项目绑定的实时计算引擎同时包含Blink及开源Flink计算引擎时,则都支持。

    • 当前状态:告警对象当前的状态,包括告警完成告警中免打扰告警中(静默期)

      • 告警完成:表示当前告警事件已完成。

      • 告警中:告警模式设置为频繁告警,告警已开始且未达到结束的状态。

      • 免打扰:系统支持将告警中告警完成状态的告警事件设置为免打扰

      • 告警中(静默期):来源不同系统的告警自定义逻辑,例如数据服务的指标采集是秒级,但告警间隔至少是5分钟。

    • 查看告警事件:您可单击告警对象的名称,查看告警事件详情。详情请参见查看告警事件详情

    • 免打扰:您可将不重要的告警对象设置为免打扰状态,详情请参见设置告警事件的状态为免打扰

    • 去处理告警:选择需要处理告警事件的对象,单击去处理去处理图标或单击某个对象名称,在告警事件详情页面,单击去处理,前往该任务页面根据告警原因处理告警事件。

查看告警事件详情

全部事件页面,单击目标对象名称,进入该告警事件详情页面。您可以查看告警对象的类型、来源系统、告警原因、告警频率、首次告警时间、最后告警时间、告警次数、告警接收人、告警方式信息,可以对该告警对象执行免打扰处理告警操作,也可以单击相关链接前往查看更多信息。image

设置告警事件的状态为免打扰

您可以将不重要的告警对象设置为免打扰状态,仅当状态为告警中告警完成时,支持配置免打扰。

  1. 选择需处理告警事件的对象,单击免打扰ddd图标或单击某个对象名称,在告警事件详情页面,单击免打扰

    image

  2. 告警免打扰对话框,选择免打扰时长,包括全天或自定义输入时长

    image

  3. 单击确定,完成免打扰配置。

    配置完成后,告警事件的当前状态由告警中告警完成变更为免打扰