算法说明

本文介绍预测算法的适用场景、参数配置等内容。

算法简介

预测算法是基于Prophet预测模型的原理进行研发的。Prophet将时序数据分解为趋势项、周期项和假日项,分别进行拟合与预测,最终整合为未来数据的预测结果。其中Prophet使用linear function或者logistic function拟合趋势项,使用傅里叶函数拟合周期项,使用indicator function与高斯分布拟合假日项。更多信息,请参见Forecasting at scale

场景说明

预测算法采用在线机器学习技术,对每个实体的每个指标进行预测,适用于一般性时序预测场景,包括:

  • 机器级别指标的预测,例如CPU使用率、内存利用率、硬盘读写速率等。

  • 业务指标的预测,例如QPS、流量、成功率、延时等。

  • 黄金指标的预测,例如描述一个域名的请求质量,则对应的黄金指标为每分钟平均响应延时、每分钟的请求数、每分钟的失败请求数等。

参数配置

您可以在创建时序预测作业配置向导的算法配置步骤中,完成算法配置。具体操作,请参见创建时序预测作业

image

参数

说明

时序预测周期

周期配置

设置时间序列的周期。其中,周期长度以天为单位,如果小于一天,可以用小数表达,例如2.4天。

时序预测作业默认考虑时序数据的周期性、周期性和周期性对时序走势的影响,针对这三个周期,不需要进行周期配置。

假日配置

所在国家

选择时序数据所在的国家。对时序数据进行预测时,时序预测作业会考虑所在国家的节假日对时序走势的影响。

其他节假日

设置影响时序走势的节假日,可设置为非常见节假日或其他影响时序走势的活动日期。

设置节假日时不仅需要设置待预测的时序中的节假日,也需要设置用于预测的、已出现的时序中的节假日。

预测配置

待测序列长度

设置待预测的时序的长度。

时间单位将影响预测的时序中的数据点数量,例如预测未来2个小时的时序数据,如果设置待测序列长度2小时,那么预测的时序中仅包含2个数据点,即每小时一个数据点;如果设置待测序列长度120分钟,那么预测的时序中将包含120个数据点,即每分钟一个数据点。

置信度

设置置信度。取值范围为0.5~0.99。置信度将影响预测结果中上下界的范围,置信度越高,预测结果中上下界之间的数据出现的可能性越高。

采样数

设置采样数。取值范围为0~100。采样数将影响预测结果中上下界的准确性,采样数越高,上下界的准确性越高。

预测频率

设置预测频率。时序预测作业是持续运行的,预测频率表示每隔多长时间进行一次预测。

观测时长

设置观测时长。观测时长表示每次预测时将基于之前多长时间的时序数据进行预测。

调度配置

时间范围

配置时序预测作业的开始时间。