告警管理是日志服务告警子系统,负责管理告警降噪和告警事务。

架构

告警管理系统接收来自于告警监控系统的告警事务,完成告警编排(例如静默、抑制、去重等),然后将告警事务发送给通知管理系统,再由通知管理系统通知用户。告警管理系统还提供了告警中心控制台,用于管理告警事务、查看告警链路中心仪表盘和规则中心仪表盘等。

日志服务告警管理系统架构如下图所示:告警管理

告警策略

告警策略是告警管理系统的配置实体,当告警管理系统接收到告警事务(含恢复通知)时,自动按照对应的告警策略,进行告警降噪等操作。

告警策略
  • 告警合并
    告警合并是将具有相同特征的告警进行分组,便于进行统一通知或后续处理,在一定程度上避免告警风暴。更多信息,请参见多种告警分组合并分组
  • 告警抑制
    告警抑制用于阻止由某告警引发的其他告警通知。例如网络异常时,会导致服务请求延迟过高或者核心链路服务异常,相关非核心服务也会产生异常。此时您最关注是快速处理严重度高、更核心的告警,其它告警延迟处理。为避免一次性发送所有告警通知,您可以使用抑制功能。更多信息,请参见告警抑制机制抑制
  • 告警静默
    告警静默用于禁止一段时间内的告警通知。例如在特定时间内维护测试环境,会产生大量的相关告警,此时可通过静默功能避免接收到大量的告警通知。更多信息,请参见告警静默机制静默
  • 告警策略继承

    告警策略之间可以有继承关系,最终的作用效果相当于父策略和子策略合并后的作用效果。更多信息,请参见告警策略继承机制

  • 数据隔离

    不同告警策略之间的数据是完全隔离的。

相关操作与说明