告警通知

通过告警通知页面,您可以实时查看系统中产生的各类告警信息,提供了详细的告警列表,包括告警发生时间、等级、来源、处理人、告警状态等相关信息。您可以根据不同的筛选条件(如告警级别、时间范围、告警名称等)快速定位特定的告警事件,以便及时采取相应的措施。通过这些功能,您能够更高效地管理和响应告警,从而确保系统的稳定运行。

操作步骤

告警通知

  1. 登录可观测链路 OpenTelemetry 版控制台

  2. 在左侧导航栏选择告警管理 > 告警通知

  3. 告警页面,您可以执行以下操作:

    • 设置筛选字段,然后单击搜索,查看对应的告警发送历史。

      字段

      说明

      告警名称

      创建的告警规则的名称。

      告警状态

      告警目前的处理状态,共有以下三种状态:

      • 待认领

      • 处理中

      • 已解决

      告警等级

      告警的严重级别。Prometheus告警规则可以在创建时指定告警规则产生的告警的级别。应用监控告警规则和前端监控告警规则产生的告警都是默认级别。

      告警级别有以下几种:

      • 默认

      • P1

      • P2

      • P3

      • P4

      • P5

      处理人

      告警的处理人。

      通知策略

      告警对应的通知策略。

      创建时间

      告警产生的时间段。

    • 在下方告警通知列表中,单击告警名称,可以查看目标告警详情。

    • 对于未解决的告警,可以认领、解决、指定告警处理人或修改告警等级。

    image

告警详情

  1. 在告警通知列表,选择目标告警,可以进入告警详情页面,显示了告警等级、发送信息、状态,以及告警基本信息、关联事件和活动记录。image

  2. 告警详情页面,您可以执行以下操作:

    • 对于未解决的告警,可以认领、解决、指定告警处理人或修改告警等级。

    • 详情事件行动活动页签可以分别查看以下信息:

      • 详情:显示了告警创建时间、告警对象、处理人和解决方案。

      • 事件:显示了告警关联事件、事件创建时间和事件状态。单击事件名称,可以查看目标事件的详细信息。

      • 行动:根据需求可以选择行动执行方式。

      • 活动:显示了告警的活动记录。image

事件详情

  • 事件页签,单击目标事件,可以在事件详情面板显示了事件的基本信息、监控数据和扩展字段。image

  • 在事件详情面板的监控数据区域,您可以执行以下操作:

    • 监控数据区域右上角,设置数据显示的时间段为告警发生时间前后的6小时、12小时或1天。

    • 使用光标选中一段时间,可以查看指定时间段的监控数据。单击重置,可以将曲线图恢复。

处理告警

在控制台告警通知列表中,对于未解决的告警,可以认领解决屏蔽指定告警处理人修改告警等级推送告警行动执行,根据需求选择处理方式。

  1. 告警页面,单击关联操作人按钮,可以选择扫码关联(仅支持钉钉)验证码关联。

    • 扫码关联:请使用移动端钉钉进行扫码登录,并绑定手机号。

    • 验证码关联:需要输入手机号和验证码进行关联绑定。

    说明
    • 操作人的名称为钉钉昵称。由于一个阿里云账号可能存在多人同时使用的情况,所以需要通过关联操作人来区分实际每次操作告警的人员。

  2. 在目标告警右侧,或者单击目标告警,在告警详情页面:

    • 单击认领,可以将自己设置为当前告警的处理人。

    • 单击解决,可以关闭目标告警。

    • 单击更多图标,然后单击指定告警处理人,可以指定钉钉群里的联系人为告警处理人。

    • 单击更多图标,然后单击修改告警等级,可以修改告警等级。

    • 单击更多图标,然后单击推送告警,可以将告警推送至指定工单系统。