配置监控与告警

创建AnalyticDB MySQL投递任务后,您可以在数据投递诊断仪表盘中查看投递任务的运行指标信息,还可以订阅仪表盘,针对仪表盘中的指标信息设置告警。本文介绍为投递任务配置监控与告警的操作步骤。

前提条件

已经将数据实时投递至OSS、MaxCompute等阿里云产品。

背景信息

数据投递诊断仪表盘中,建议您关注如下两方面的指标信息。

  • 系统层面:投递的消费延迟、是否有异常报错。

  • 业务层面:处理日志行数、输出日志行数。

创建告警

  1. 登录日志服务控制台

  2. 在Project列表区域,单击目标Project。

  3. 在左侧导航栏中,单击告警

  4. 告警规则页签中,单击新建告警右侧的image

  5. 单击从模板新建

  6. 从模板新建页签中,单击SLS数据投递

  7. 筛选目标任务,为不同指标设置告警。

    如何设置告警,请参见设置告警;如何订阅仪表盘,请参见订阅仪表盘

数据投递延迟告警

  1. shard消费延迟图表中,单击配置监控与告警 > 创建告警

  2. 配置告警。

    例如:触发条件设置为delay > 120,表示阈值大于120秒时告警。更多信息,请参见设置告警投递延迟

  3. 配置通知方式。

    此处以WebHook-钉钉机器人为例。更多信息,请参见通知方式投递延迟

  4. 在钉钉群中,查看告警通知。

    投递延迟

配置异常报错告警

  1. 详情日志图表中,单击配置监控与告警 > 创建告警

  2. 配置告警。

    例如:触发条件设置为level == 'ERROR'。更多信息,请参见设置告警

    异常报错

  3. 配置通知方式。

    此处以WebHook-钉钉机器人为例。更多信息,请参见通知方式异常告警

  4. 在钉钉群中,查看告警通知。

    异常告警

配置投递流量(绝对值)告警

  1. 每秒投递行数图表中,单击配置监控与告警 > 创建告警

  2. 配置告警。

    例如:触发条件设置为delivered < 2000,表示当每秒处理日志条数少于2千行时产生告警。更多信息,请参见设置告警

    投递流量

  3. 配置通知方式。

    此处以WebHook-钉钉机器人为例。更多信息,请参见通知方式投递流量

  4. 在钉钉群中,查看告警通知。

    投递流量

配置投递流量(日同比)告警

  1. 自定义监控指标。

    1. 日志存储 > 日志库页签中,单击internal-export-log

    2. 输入如下查询分析语句,单击查询/分析

      该查询分析语句计算每5分钟投递的日志行数与昨日同比的指标。

      *| select dt, today, yesterday, round((today - yesterday) * 100.0 / yesterday, 3) as inc_ration from
      (select dt, (case when diff[1] is null then 0 else diff[1] end) as today, (case when diff[2] is null then 0 else diff[2] end) as yesterday from 
      (select dt, compare("delivered lines", 86400) as diff from 
      (select date_format(__time__ - __time__ % 300, '%H:%i') as dt, sum(delivered) as "delivered lines" from log group by dt order by dt asc limit 5000)
      group by dt order by dt asc limit 5000))
      说明

      您还可以修改该查询分析语句以设置更精确的告警指标。例如只对任务ID为5a04f1d44d44db3005fd268f39c1aebf的任务设置告警。

      __tag__:__schedule_id__:  5a04f1d44d44db3005fd268f39c1aebf | select dt, today, yesterday, round((today - yesterday) * 100.0 / yesterday, 3) as inc_ration from
      (select dt, (case when diff[1] is null then 0 else diff[1] end) as today, (case when diff[2] is null then 0 else diff[2] end) as yesterday from 
      (select dt, compare("delivered lines", 86400) as diff from 
      (select date_format(__time__ - __time__ % 300, '%H:%i') as dt, sum(delivered) as "delivered lines" from log group by dt order by dt asc limit 5000)
      group by dt order by dt asc limit 5000))
    3. 统计图表中,选择线图,并单击添加到仪表盘,添加该查询结果到仪表盘(此处以export-adb-monitor仪表盘为例)。

      投递流量同比

  2. 在左侧导航栏中,单击配置监控与告警-001图标。

  3. 仪表盘列表中,单击export-adb-monitor

  4. export-adb-monitor仪表盘中,找到目标图表,单击配置监控与告警 > 创建告警

    投递流量同比

  5. 配置告警。

    例如,触发条件设置为inc_ratio < (-40),表示当日志投递速率比昨日下降40%时告警。更多信息,请参见设置告警

    投递流量同比

  6. 配置通知方式。

    此处以WebHook-钉钉机器人为例。更多信息,请参见通知方式投递流量同比

  7. 在钉钉群中,查看告警通知。

    投递流量同比

告警相关操作

您可以在告警列表中进行删除、修改或禁用通知操作。更多信息,请参见管理告警