创建时序预测作业

日志服务提供时序预测功能,用于对时序数据进行自动化、智能化的预测。您可以根据预测结果判断时序数据未来的走势,提前感知系统或者业务关键指标的状态。本文介绍创建时序预测作业的操作步骤。

前提条件

  • 已采集数据到Logstore或MetricStore。具体操作,请参见数据采集概述

  • 如果是采集到Logstore,则需配置源Logstore的索引。具体操作,请参见创建索引

  • 已创建智能异常分析实例。具体操作,请参见创建实例

操作步骤

  1. 登录日志服务控制台

  2. 进入创建作业页面。

    1. 日志应用区域,单击智能异常分析

    2. 在实例列表中,单击目标实例。

    3. 在左侧导航栏中,单击时序预测

    4. 时序预测任务区域,单击立即创建

  3. 创建时序预测作业配置向导的基础信息步骤中,完成如下配置,然后单击下一步

    参数

    说明

    任务名

    设置时序预测作业的名称。

    Project

    选择源日志库或时序库所在的Project。

    地域

    您所选择的Project的所在地域。

    日志库类型

    根据您数据存储的位置选择日志库类型。

    • 如果您的数据存储在日志库中,则选中日志库

    • 如果您的数据存储在时序库中,则选中时序库

    源日志库

    日志库类型设置为日志库时,需设置源日志库,设置为您的源数据所在的日志库。

    时序库

    日志库类型设置为时序库时,需设置时序库,设置为您的源数据所在的时序库。

    角色

    如果您在创建实例时已完成了授权,则此处自动显示AliyunLogETLRole角色的角色标识。

    目标库

    目标日志库,固定为internal-ml-log。

  4. 创建时序预测作业配置向导的数据特征配置步骤中,输入查询和分析语句,然后完成以下配置。

    此处通过日志服务查询和分析语句获取时序数据,示例如下所示。更多信息,请参见查询概述分析概述

    * | select (__time__ - __time__%60) as time, 'entity' as entity, count(1) as metric from log group by time, entity order by time

    时序预测

    参数

    说明

    时间

    源数据中用于标识时间列的字段。建议至少以分钟级别以上的粒度对数据进行聚合。

    实体

    源数据中用于标识具体实体的字段。时序预测作业围绕实体标识,聚合出时间序列。配置实体字段后,页面下方将展示实体列表。

    选择目标实体后,系统将预测该实体的时间序列。如果未选择任何实体,系统将预测全部实体的时间序列。

    特征

    源数据中用于标识具体特征的字段。时序预测作业分别对每个实体的每个特征进行预测,如果实体数量是m个,特征数量是n个,那么时序预测作业将对m×n个时间序列进行预测。

    目前每个时序预测作业最多同时预测5个时间序列。如果配置的时间序列超出限制,则时序预测将随机选择5个时间序列进行预测。

  5. 创建时序预测作业配置向导的算法配置步骤中,完成如下配置,然后单击完成

    时序预测

    参数

    说明

    时序预测周期

    周期配置

    设置时间序列的周期。其中,周期长度以天为单位,如果小于一天,可以用小数表达,例如2.4天。

    时序预测作业默认考虑时序数据的周期性、周期性和周期性对时序走势的影响,针对这三个周期,不需要进行周期配置。

    假日配置

    所在国家

    选择时序数据所在的国家。对时序数据进行预测时,时序预测作业会考虑所在国家的节假日对时序走势的影响。

    其他节假日

    设置影响时序走势的节假日,可设置为非常见节假日或其他影响时序走势的活动日期。

    设置节假日时不仅需要设置待预测的时序中的节假日,也需要设置用于预测的、已出现的时序中的节假日。

    预测配置

    待测序列长度

    设置待预测的时序的长度。

    时间单位将影响预测的时序中的数据点数量,例如预测未来2个小时的时序数据,如果设置待测序列长度2小时,那么预测的时序中仅包含2个数据点,即每小时一个数据点;如果设置待测序列长度120分钟,那么预测的时序中将包含120个数据点,即每分钟一个数据点。

    置信度

    设置置信度。取值范围为0.5~0.99。置信度将影响预测结果中上下界的范围,置信度越高,预测结果中上下界之间的数据出现的可能性越高。

    采样数

    设置采样数。取值范围为0~100。采样数将影响预测结果中上下界的准确性,采样数越高,上下界的准确性越高。

    预测频率

    设置预测频率。时序预测作业是持续运行的,预测频率表示每隔多长时间进行一次预测。

    观测时长

    设置观测时长。观测时长表示每次预测时将基于之前多长时间的时序数据进行预测。

    调度配置

    时间范围

    配置时序预测作业的开始时间。

  6. 可以在预览区查看当前参数配置下的算法效果。

    1. 设置时间范围,确定待预测的时间序列的起始和结束时间。单击数据查询,将使用在数据特征配置中设置的查询分析语句,处理指定时间范围的数据,生成时序数据。

    2. 选择实体信息,确定待预测的实体序列。单击预览将会调用预测算法处理指定的实体序列,并在下方展示预测结果。单击显示参数,会显示当前算法的参数配置。

    3. 预测结果中包含拟合历史序列后得到的序列上界和序列下界,大于序列上界或者小于序列下界的数据点可能是异常数据点,通过调节异常阈值,可以显示异常分数大于阈值的异常点。

预测结果

创建时序预测作业后,您可以在作业列表中,单击目标作业,查看时序预测作业详情。您还可以通过预测ID、实体ID、指标和时间筛选时间序列:

参数

说明

时间

通过选择不同的时间,您可以查看时序预测作业在对应时间段内的预测结果。

预测ID

时序预测作业会随时间推移进行持续预测,每次预测都有一个唯一的ID标识,即预测ID,格式为Pred-{timestamp},其中{timestamp}表示时序预测作业进行预测时的时间戳,精确到秒级。

实体ID

通过选择实体ID,查看目标实体对应的时间序列。

指标

通过选择指标,查看目标指标对应的时间序列。

下图中红色竖线左侧的曲线表示已出现的时序数据(时序预测作业基于该数据进行预测),红色竖线右侧的曲线为预测的时序数据。

您还可以单击查看异常事件,查看在对应的时序预测过程中出现的错误信息。

时序巡检

相关操作

创建时序预测作业后,您可以在时序预测页面中,找到目标时序预测作业进行删除或修改操作。

重要

时序预测作业被删除后,不可恢复,请您谨慎操作。