高级监控报警服务为您所有区域的Elasticsearch集群提供全维度指标和日志监控分析服务,不仅为您提供了多个维度下的可视化监控数据,还支持您根据业务需要自定义监控大屏和报警规则。本文为您介绍如何使用日志报警功能配置报警。

前提条件

使用限制

  • 目前仅国内的杭州、北京、上海、深圳、青岛、张家口6个区域的实例支持接入高级监控报警服务。
  • 日志报警通知仅支持DingDing和Webhook两种方式,其他方式不支持。
  • 钉钉机器人中自定义关键词必须是OKAlerting,否则接收不到报警,如下图:钉钉联系人关键词设置

操作流程

  1. 步骤一:进入高级监控报警页面
  2. 步骤二:配置日志报警联系人相关信息
  3. 步骤三:配置日志报警规则
  4. 步骤四:查看日志报警规则

步骤一:进入高级监控报警页面

  1. 登录阿里云Elasticsearch控制台
  2. 在左侧导航栏,单击高级监控报警

步骤二:配置日志报警联系人相关信息

  1. 高级监控报警页面的左侧导航栏中,选择监控可视化 > 日志监控
  2. 单击配置日志报警,进入Grafana页面。
  3. 单击左侧Alerting图标图标,选择Notification channels
    Alerting
  4. 配置通知渠道。填写信息可参考如下内容:
    参数 说明
    Name 自定义报警名称。本操作中使用的样例值为test
    Type 仅支持DingDing和Webhook提醒,其他不支持。本操作中使用的样例值为DingDing
    Url 钉钉机器人webhook路径。
    Message Type 消息类型,仅支持Link
    配置Alerting参数
  5. 单击Save,保存配置信息。

步骤三:配置日志报警规则

  1. 高级监控报警页面的左侧导航栏中,选择监控可视化 > 日志监控
  2. 单击配置日志报警,进入Grafana页面。
    进入Grafana页面
  3. 使用报警模板配置日志报警规则(日志报警模板不支持直接编辑)。
    1. 在Grafana页面,单击监控模板上的监控模板图标图标。
    2. 在对话框中,单击Export页签。
      Export
    3. 单击View JSON
    4. 单击Copy to Clipboard,复制JSON模板。
    5. 单击左侧左侧加号图标,选择Import
    6. Import via panel json中,粘贴JSON模板中默认的报警规则。
      粘贴报警规则
    7. 单击Load
    8. 修改Name,并重新定义Unique identifier (uid)
    9. 单击Import,即可完成模板的导入。
      导入模板
  4. 调整报警规则。

    以配置慢查询耗时超阈值条数报警为例。

    1. 单击慢查询耗时超阈值条数,从下拉列表中选择Edit
      单击Edit
    2. 单击Query页签,设置查询条件。当满足该查询条件时,将触发报警检测机制。
      设置Query查询条件
    3. 单击Alert页签,设置RuleConditions
      系统默认报警规则
      说明
      • 系统默认报警规则为:每5分钟执行一次Query条件,在每一个过去的5分钟内,各时间点下慢查询耗时超过1000ms的日志条数平均值大于10条,且该状态持续超过1分钟,则系统上报告警。
      • Evaluate every为检测频率,最小值可配置1分钟,其他配置项无限制。
    4. 单击Send to后的加号图标,添加步骤二中已经配置好的日志报警联系人。
      添加步骤二中默认配置好的信息
    5. 单击Save
    6. 单击Apply
    说明 配置中未提及的项,可使用默认值,也可按需配置,更高阶的报警配置可以参考Grafana官方文档

步骤四:查看日志报警规则

  1. 高级监控报警页面的左侧导航栏中,选择监控可视化 > 日志监控
  2. 单击配置日志报警,进入Grafana页面。
  3. 单击左侧Alerting图标图标,选择Alert Rules,获取报警规则列表。
    获取报警规则列表
说明 您还可以通过监控可视化 > 自定义监控查看成功配置的报警大盘。