创建AnalyticDB MySQL或TSDB投递任务后,您可以在数据投递诊断仪表盘中查看投递任务的运行指标信息,还可以订阅仪表盘,针对仪表盘中的指标信息设置告警。本文介绍为投递任务配置监控与告警的操作步骤。

背景信息

数据投递诊断仪表盘中,建议您关注如下两方面的指标信息。
  • 系统层面:投递的消费延迟、是否有异常报错。
  • 业务层面:处理日志行数、输出日志行数。

创建告警

  1. 登录日志服务控制台
  2. Project列表区域,单击目标Project。
  3. 在左侧导航栏中,单击配置监控与告警-001图标。
  4. 仪表盘列表中,单击数据投递诊断
  5. 数据投递诊断页面,筛选目标作业,为不同指标设置告警。
    如何设置告警,请参见设置告警;如何订阅仪表盘,请参见订阅仪表盘

配置投递延迟告警

  1. shard消费延迟图表中,单击配置监控与告警 > 创建告警
  2. 配置告警。
    例如:触发条件设置为delay > 120,表示阈值大于120秒时告警。更多信息,请参见设置告警投递延迟
  3. 配置通知方式。
    此处以WebHook-钉钉机器人为例。更多信息,请参见通知方式投递延迟
  4. 在钉钉群中,查看告警通知。
    投递延迟

配置异常报错告警

  1. 详情日志图表中,单击配置监控与告警 > 创建告警
  2. 配置告警。

    例如:触发条件设置为level == 'ERROR'。更多信息,请参见设置告警

    异常报错
  3. 配置通知方式。
    此处以WebHook-钉钉机器人为例。更多信息,请参见通知方式异常告警
  4. 在钉钉群中,查看告警通知。
    异常告警

配置投递流量(绝对值)告警

  1. 每秒投递行数图表中,单击配置监控与告警 > 创建告警
  2. 配置告警。

    例如:触发条件设置为accept < 2000,表示当每秒处理日志条数少于2千行时产生告警。更多信息,请参见设置告警

    投递流量
  3. 配置通知方式。
    此处以WebHook-钉钉机器人为例。更多信息,请参见通知方式投递流量
  4. 在钉钉群中,查看告警通知。
    投递流量

配置投递流量(日同比)告警

  1. 自定义监控指标。
    1. 日志存储 > 日志库页签中,单击internal-export-log
    2. 输入如下查询分析语句,单击查询/分析
      该查询分析语句计算每5分钟投递的日志行数与昨日同比的指标。
      *| select dt, today, yesterday, round((today - yesterday) * 100.0 / yesterday, 3) as inc_ration from
      (select dt, (case when diff[1] is null then 0 else diff[1] end) as today, (case when diff[2] is null then 0 else diff[2] end) as yesterday from 
      (select dt, compare("delivered lines", 86400) as diff from 
      (select date_format(__time__ - __time__ % 300, '%H:%i') as dt, sum(delivered) as "delivered lines" from log group by dt order by dt asc limit 5000)
      group by dt order by dt asc limit 5000))
      说明 您还可以修改该查询分析语句以设置更精确的告警指标。例如只对任务ID为5a04f1d44d44db3005fd268f39c1aebf的任务设置告警。
      __tag__:__schedule_id__:  5a04f1d44d44db3005fd268f39c1aebf | select dt, today, yesterday, round((today - yesterday) * 100.0 / yesterday, 3) as inc_ration from
      (select dt, (case when diff[1] is null then 0 else diff[1] end) as today, (case when diff[2] is null then 0 else diff[2] end) as yesterday from 
      (select dt, compare("delivered lines", 86400) as diff from 
      (select date_format(__time__ - __time__ % 300, '%H:%i') as dt, sum(delivered) as "delivered lines" from log group by dt order by dt asc limit 5000)
      group by dt order by dt asc limit 5000))
    3. 统计图表中,选择线图,并单击添加到仪表盘,添加该查询结果到仪表盘(此处以export-adb-monitor仪表盘为例)。
      投递流量同比
  2. 在左侧导航栏中,单击配置监控与告警-001图标。
  3. 仪表盘列表中,单击export-adb-monitor
  4. export-adb-monitor仪表盘中,找到目标图表,单击配置监控与告警 > 创建告警
    投递流量同比
  5. 配置告警。

    例如,触发条件设置为inc_ration < (-40),表示当日志投递速率比昨日下降40%时告警。更多信息,请参见设置告警

    投递流量同比
  6. 配置通知方式。
    此处以WebHook-钉钉机器人为例。更多信息,请参见通知方式投递流量同比
  7. 在钉钉群中,查看告警通知。
    投递流量同比

告警相关操作

您可以在告警列表中进行删除、修改或禁用通知操作。更多信息,请参见管理告警配置