日志服务提供智能巡检功能,用于对监控指标或业务日志等数据进行全自动、智能化、自适应的异常巡检。本文介绍如何通过智能巡检功能,对多维指标进行巡检与打标反馈。

前提条件

  • 已采集EIP指标数据到名为eip-log的源Logstore。具体操作,请参见数据采集概述
  • 已配置源Logstore的索引。具体操作,请参见创建索引
  • 已创建智能异常分析实例。具体操作,请参见创建实例

背景信息

日志服务智能巡检服务支持对指标数据进行智能巡检。指标数据一般可通过定时SQL定时聚合生成,也可以通过SDK或控制台写入,包含如下必要信息:
  • 时间项:默认是时间字段__time__,建议数据的间隔最好保持一致(例如一分钟一条数据)。
  • 实体项:一个监控对象的一个字段或多个字段。
  • 特征项:字段值为具体数值的字段,字段值为数值类型。对于多维指标,特征项至少2个。
重要 时间项、实体项和特性项所涉及的字段都需配置索引。

当您已经拥有一份多维指标数据时,您可以参见本文创建智能巡检任务。

数据示例

例如A公司将其EIP指标数据接入到日志服务后,并通过智能巡检服务监控入方向数据包速率(inpps)和出方向数据包速率(outpps),即设置实体eip,设置特征inppsoutpps。当弹性公网IP出现问题时,日志服务将展示入方向数据包速率和出方向数据包速率等不同维度指标的变化,并通过钉钉群通知给运维人员,便于运维人员及时判断故障,解决问题。

EIP指标数据如下图所示。

数据示例

步骤一:创建智能巡检任务

  1. 登录日志服务控制台
  2. 进入创建作业页面。
    1. 日志应用区域,单击智能异常分析
    2. 在实例列表中,单击目标实例。
    3. 在左侧导航栏中,单击智能巡检
    4. 巡检任务区域,单击立即创建
  3. 创建智能巡检作业配置向导的基本信息区域,完成如下配置,然后单击下一步
    基础信息
  4. 创建智能巡检作业配置向导的算法配置区域,完成以下操作。
    1. 数据特征配置区域的数据类型中,选择通过消费组,然后完成以下配置。
      数据特征
    2. 算法配置区域,完成以下配置,然后在数据采样中,选择一个实体,单击预览采样数据,验证您所配置的参数与您的数据是否适配,以及执行结果是否符合您的预期。
      算法配置
    3. 调度配置区域,设置智能巡检作业开始执行的时间和数据延时时长。
      说明 智能巡检作业默认从设置的位置开始一直往后执行。
    4. 单击下一步
  5. 创建智能巡检作业配置向导的告警配置区域,完成以下配置,然后单击完成
    如何获取钉钉请求地址,请参见钉钉-自定义
    告警
    当指标异常时,即result.score大于0.75时,日志服务将发送告警通知到钉钉群中。

步骤二:打标反馈

您可以在钉钉群,打标告警通知。

  • 如果告警符合预期,单击确认
  • 如果告警不符合预期,单击误报