智能巡检功能用于对业务日志进行自动化、智能化、自适应的异常巡检。本文介绍通过消费组拉取指标数据进行智能巡检的操作步骤。
前提条件
注意 本文中所涉及的Logstore为Standard Logstore。更多信息,请参见管理Logstore。
操作步骤
- 登录日志服务控制台。
- 进入创建作业页面。
- 在日志应用区域,单击智能异常分析。
- 在实例列表中,单击目标实例。
- 在左侧导航栏中,单击智能巡检。
- 在巡检任务区域,单击立即创建。
- 在创建智能巡检作业配置向导的基本信息区域,完成如下配置,然后单击下一步。
参数 说明 作业名 自定义设置智能巡检作业的名称。 Project 选择源日志库所在的Project。 地域 显示您所选择的Project的所在地域。 日志库类型 选择日志库。 通过消费组拉取指标数据进行智能巡检时,只支持日志库。
源日志库 选择源数据所在的日志库。 角色 如果您在创建实例时已完成了授权,则此处自动显示AliyunLogETLRole角色的角色标识。 目标日志库 目标日志库,固定为internal-ml-log。 - 在创建智能巡检作业配置向导的算法配置区域,完成以下操作。
- 在数据特征配置区域的数据类型中,选择通过消费组,然后完成以下配置。
参数 说明 时间 源数据中用于标识时间列的字段。日志服务默认使用Logstore中的 _time_
字段。粒度 数据的观测间隔。单位为秒。取值范围为5~3600。 实体 源数据中用于标识具体实体的字段。智能巡检作业围绕实体标识,聚合出时间序列。 特征 源数据中用于标识具体特征数据的字段。如果您不确定特征项的取值范围,可以不设置特征数据的最大值和最小值。更多信息,请参见如何设置数据特征中的最小值和最大值。 - 在算法配置区域,完成以下配置,然后在数据采样中,选择一个实体,单击预览采样数据,验证您所配置的参数与您的数据是否适配,以及执行结果是否符合您的预期。
参数 说明 算法选择 异常检测算法。默认为流式图算法。更多信息,请参见算法说明。 时序分段个数 对时序数值进行划分,用于离散化时间序列,构造时序演化图,降低噪音的影响。 - 默认值为8。
- 建议值范围为[5,20]。
- 分段越少,对噪音越不敏感。
观测长度 所需观测的历史数据点个数。 - 默认值为2880。
- 建议值范围为[200,4000]。
- 建议取值涵盖2个周期。例如,某个时间序列的观测点时间间隔为1分钟、周期为1天,则该时间序列2个周期有2880个观测点,建议观测长度的取值大于等于2880。
敏感度 异常分数输出的敏感度。 - 异常分数大于0.5表示异常,异常分数大于0.75则触发告警。
- 敏感度设置越高,模型量化每个异常点的分数越高。
- 在调度配置区域,完成如下配置。
参数 说明 开始时间 设置调度开始的时间。 说明 智能巡检作业默认从设置的位置开始一直往后执行。数据延时时长 设置调度时间点往后延迟执行的时间。取整范围:0~120,单位:秒。 当数据写入Logstore存在延迟时,可通过延迟执行来保证数据的完整性。
- 单击下一步。
- 在数据特征配置区域的数据类型中,选择通过消费组,然后完成以下配置。
- 在创建智能巡检作业配置向导的告警配置区域,完成以下配置,然后单击完成。
参数 说明 告警策略 告警策略用于合并、静默和抑制已产生的告警。 - 选择极简模式和普通模式时,您无需配置告警策略。日志服务默认使用SLS内置动态告警策略(sls.builtin.dynamic)进行告警管理。
- 选择高级模式时,您可以选择内置的或自定义的告警策略进行告警管理。如何创建告警策略,请参见创建告警策略。
行动策略 行动策略用于控制告警通知渠道和频率等。
巡检结果
创建智能巡检作业后,您可以在作业列表中,单击目标作业,查看巡检作业详情。

相关操作
创建智能巡检作业后,您可以在智能巡检页面中,找到目标作业进行修改或删除操作。
注意 智能巡检作业被删除后,不可恢复,请您谨慎操作。