本文介绍预测算法的适用场景、参数配置等内容。

算法简介

预测算法是基于Prophet预测模型中的原理进行研发的。Prophet将时序数据分解为趋势项、周期项和假日项,分别进行拟合与预测,最终整合为未来数据的预测结果。其中Prophet使用linear function或者logistic function拟合趋势项,使用傅里叶函数拟合周期项,使用indicator function与高斯分布拟合假日项。更多信息,请参见Forecasting at scale

场景说明

预测算法采用在线机器学习技术,对每个实体的每个指标进行预测,适用于一般性时序预测场景,包括:
  • 机器级别指标的预测,例如CPU使用率、内存利用率、硬盘读写速率等。
  • 业务指标的预测,例如QPS、流量、成功率、延时等。
  • 黄金指标的预测,例如描述一个域名的请求质量,则对应的黄金指标为每分钟平均响应延时、每分钟的请求数、每分钟的失败请求数等。

参数配置

您可以在创建时序预测作业配置向导的算法配置步骤中,完成算法配置。具体操作,请参见创建时序预测作业

时序预测
参数 说明
时序预测周期
周期配置 设置时间序列的周期。其中,周期长度以天为单位,如果小于一天,可以用小数表达,例如2.4天。

时序预测作业默认考虑时序数据的天周期性、周周期性和年周期性对时序走势的影响,针对这三个周期,不需要进行周期配置。

假日配置
所在国家 选择时序数据所在的国家。对时序数据进行预测时,时序预测作业会考虑所在国家的节假日对时序走势的影响。
其他节假日 设置影响时序走势的节假日,可设置为非常见节假日或其他影响时序走势的活动日期。

设置节假日时不仅需要设置待预测的时序中的节假日,也需要设置用于预测的、已出现的时序中的节假日。

预测配置
待测序列长度 设置待预测的时序的长度。

时间单位将影响预测的时序中的时间点数量,例如预测未来2个小时的时序数据,如果设置待测序列长度2小时,那么预测的时序中仅包含2个数据点,即每小时一个数据点;如果设置待测序列长度120分钟,那么预测的时序中将包含120个数据点,即每分钟一个数据点。

置信度 设置置信度。取值范围为0.5~0.99。置信度将影响预测结果中上下界的范围,置信度越高,预测结果中上下界之间的数据出现的可能性越高。
采样数 设置采样数。取值范围为0~100。采样数将影响预测结果中上下界的准确性,采样数越高,上下界的准确性越高。
预测频率 设置预测频率。时序预测作业是持续运行的,预测频率表示每隔多长时间进行一次预测。
观测时长 设置观测时长。观测时长表示每次预测时将基于之前多长时间的时序数据进行预测。
调度配置
时间范围 配置时序预测作业的开始时间。