本文介绍未收到告警通知的排查思路。

排查流程

排除流程

操作步骤

  1. 登录日志服务控制台
  2. 在Project列表区域,单击目标Project。
    该Project为您告警监控规则所属的Project。
  3. 在左侧导航栏中,单击告警
  4. 查看告警历史统计仪表盘,确认告警是否已触发。
    1. 规则/事务页签中,单击目标告警监控规则。
    2. 告警历史图表中,确认告警是否已触发。
      告警历史
      • 如果原因为Successful,表示已触发告警,请执行下一步。
      • 如果原因不为Successful,表示未触发告警,请根据如下思路排查。
        • 如果执行结果不为Success,表示告警监控规则执行失败,请结合告警排障中心仪表盘中的告警监控规则错误图表分析原因。
        • 如果执行结果为Success,表示此次评估统计结果成功,但与是否满足触发条件、是否触发告警、是否通知无关。此时您可以通过原因列的内容分析原因。
          原因 说明
          Alert condition not met 此次的统计结果未满足触发条件。例如您设置的触发条件errCnt > 100,但实际未达到100,不会触发告警。
          Notify threshold not reached 此次触发未达到连续触发阈值。例如您设置连续触发阈值为3次,那么连续3次都满足触发条件,才会真正触发告警。
          Notification throttled 此处触发未满足通知间隔,通常为旧版告警中的问题。例如您设置的通知间隔为10分钟,而此次通知距离上次不满10分钟,不会触发告警。
  5. 查看告警历史统计仪表盘,确认通知发送状态是否为Success。
    告警历史图表中,查看通知发送状态
    • 通知发送状态为Success,表示告警监控系统已发送告警给告警管理系统,请执行下一步。
      说明 该Success不代表告警系统已将告警通知发送给告警接收人,仅代表告警监控系统已将告警发送给告警管理系统。
    • 通知发送状态不为Success,表示告警监控系统发送告警给告警管理系统失败,请提工单联系日志服务技术支持人员。
  6. 查看告警排障中心仪表盘,确认是否存在故障。
    1. 在左侧导航栏中,单击告警,然后选择告警管理 > 告警排障中心
    2. 查看全局配置错误数和通知渠道错误数。
      • 如果全局配置错误数或通知渠道错误数不为0,说明存在故障,请查看全局配置故障渠道通知错误图表中的详情,并参见错误码进行排查。
      • 如果全局配置错误数和通知渠道错误数为0,说明无故障,请提工单联系日志服务技术支持人员。