本文介绍预测算法的适用场景、参数配置等内容。
算法简介
预测算法是基于Prophet预测模型的原理进行研发的。Prophet将时序数据分解为趋势项、周期项和假日项,分别进行拟合与预测,最终整合为未来数据的预测结果。其中Prophet使用linear function或者logistic function拟合趋势项,使用傅里叶函数拟合周期项,使用indicator function与高斯分布拟合假日项。更多信息,请参见Forecasting at scale。
场景说明
预测算法采用在线机器学习技术,对每个实体的每个指标进行预测,适用于一般性时序预测场景,包括:
机器级别指标的预测,例如CPU使用率、内存利用率、硬盘读写速率等。
业务指标的预测,例如QPS、流量、成功率、延时等。
黄金指标的预测,例如描述一个域名的请求质量,则对应的黄金指标为每分钟平均响应延时、每分钟的请求数、每分钟的失败请求数等。
参数配置
您可以在创建时序预测作业配置向导的算法配置步骤中,完成算法配置。具体操作,请参见创建时序预测作业。
参数 | 说明 |
时序预测周期 | |
周期配置 | 设置时间序列的周期。其中,周期长度以天为单位,如果小于一天,可以用小数表达,例如2.4天。 时序预测作业默认考虑时序数据的天周期性、周周期性和年周期性对时序走势的影响,针对这三个周期,不需要进行周期配置。 |
假日配置 | |
所在国家 | 选择时序数据所在的国家。对时序数据进行预测时,时序预测作业会考虑所在国家的节假日对时序走势的影响。 |
其他节假日 | 设置影响时序走势的节假日,可设置为非常见节假日或其他影响时序走势的活动日期。 设置节假日时不仅需要设置待预测的时序中的节假日,也需要设置用于预测的、已出现的时序中的节假日。 |
预测配置 | |
待测序列长度 | 设置待预测的时序的长度。 时间单位将影响预测的时序中的数据点数量,例如预测未来2个小时的时序数据,如果设置待测序列长度为2小时,那么预测的时序中仅包含2个数据点,即每小时一个数据点;如果设置待测序列长度为120分钟,那么预测的时序中将包含120个数据点,即每分钟一个数据点。 |
置信度 | 设置置信度。取值范围为0.5~0.99。置信度将影响预测结果中上下界的范围,置信度越高,预测结果中上下界之间的数据出现的可能性越高。 |
采样数 | 设置采样数。取值范围为0~100。采样数将影响预测结果中上下界的准确性,采样数越高,上下界的准确性越高。 |
预测频率 | 设置预测频率。时序预测作业是持续运行的,预测频率表示每隔多长时间进行一次预测。 |
观测时长 | 设置观测时长。观测时长表示每次预测时将基于之前多长时间的时序数据进行预测。 |
调度配置 | |
时间范围 | 配置时序预测作业的开始时间。 |