为定时SQL任务设置告警

日志服务定时SQL已内置监控规则模板,您只需添加对应的告警规则即可实时监控定时SQL任务,并可通过钉钉等渠道接收到告警通知。本文介绍设置告警的相关操作。

前提条件

已创建定时SQL任务。

  • 如果是将源Logstore中的数据通过定时SQL处理后存储到目标Logstore,请参见从Logstore到Logstore

  • 如果是将源Logstore中的数据通过定时SQL处理后存储到目标MetricStore中,请参见从Logstore到MetricStore

  • 如果是将源MetricStore中的数据通过定时SQL处理后存储到目标MetricStore中,请参见从MetricStore到MetricStore

步骤一:开启任务运行日志

  1. 登录日志服务控制台

  2. 在Project列表区域,单击目标Project。

    该Project为定时SQL任务所在的Project。

  3. 在页面左上方,单击概览图标。

    image

  4. 进入开通任务运行日志页面。

    • 如果您未开通该Project的详细日志,则在服务日志页签中,单击开通详细日志

    • 如果您已开通过该Project的详细日志,则在服务日志页签中,单击服务日志图标。

  5. 设置如下参数,然后单击确定

    参数

    说明

    任务运行日志

    打开任务运行日志开关后,系统将在您指定的Project中自动创建一个名为internal-diagnostic_log的Logstore,用于存储定时SQL、MaxCompute投递、OSS投递、数据导入等任务的运行日志与错误日志。日志字段说明,请参见定时SQL任务运行日志

    日志存储位置

    开通任务运行日志功能后,需要选择日志的存储位置,即需要指定Project。可以设置为:

    • 自动创建(推荐)。

    • 当前Project。

    • 同一地域下的其他Project。

    开通任务运行日志后,如果定时SQL任务执行失败,您可以在指定Project下的internal-diagnostic_log Logstore中查看定时SQL任务的错误日志。其中定时SQL任务的错误日志的日志主题(__topic__)为scheduled_sql_alert。

步骤二:配置行动策略

  1. 登录日志服务控制台

  2. 进入行动策略管理页面。

    1. 在Project列表区域,单击任意的Project。

    2. 在左侧导航栏中,单击告警

    3. 选择通知策略 > 行动策略

  3. 找到目标行动策略(sls.app.scheduled_sql.builtin),单击修改

    您也可以创建新的行动策略用于告警通知。具体操作,请参见创建行动策略

  4. 编辑行动策略页面中,将请求地址修改为钉钉群机器人的Webhook地址。其他选项,保持默认配置。

    如何获取钉钉群机器人的WebHook地址,请参见钉钉-自定义。您也可以根据业务需求,使用其他告警渠道。具体操作,请参见通知渠道说明

  5. 单击确认

步骤三:添加告警规则

日志服务已内置如下两种监控规则模板,您只需根据业务需求,添加对应的告警规则即可。两种告警规则的配置参数类似,此处以添加定时SQL任务执行延迟监控规则对应的告警规则为例。

  • 定时SQL任务执行错误监控:每5分钟检测一次,当定时SQL任务出现错误后,触发告警。

  • 定时SQL任务执行延迟监控:每5分钟检测一次,当定时SQL任务的延迟时间超过指定阈值后,触发告警。

  1. 登录日志服务控制台

  2. 在Project列表区域,单击目标Project。

    该Project为您internal-diagnostic_log Logstore所在的Project。

  3. 在左侧导航栏中,单击告警

  4. 告警规则页签中,单击新建告警右侧的image

  5. 单击从模板新建

  6. 从模板新建面板中,单击SLS定时SQL

  7. 单击定时SQL任务执行延迟监控

  8. 配置告警规则。

    • 如果您有特定的需求,例如监控指定的Project、调整触发阈值等,请参见创建日志告警监控规则进行调整,否则保持默认配置即可。

    • 如果您在步骤二新建了一个行动策略,则需要在输出目标 > SLS通知 > 行动策略配置新建的行动策略。

  9. 添加完成后,您可以在监控规则列表中查看已开启的告警规则。Scheduled SQL告警