日志服务(Log Service)机器学习功能为您提供多种功能丰富的算法和便捷的调用方式,您可以在日志查询分析中通过SELECT语句和机器学习函数调用机器学习算法,分析某一字段或若干字段在一段时间内的特征。

尤其是针对时序数据分析场景,日志服务提供了丰富的时序分析算法,可以帮助您快速解决时序预测、时序异常检测、序列分解、多时序聚类等场景问题,兼容SQL标准接口,大大降低了您使用算法的门槛,提高分析问题和解决问题的效率。

功能特点

  • 支持单时序序列的多种平滑操作。
  • 支持单时序序列的预测、异常检测、变点检测、折点检测、多周期估计算法。
  • 支持单时序序列的分解操作。
  • 支持多时序序列的多种聚类算法。
  • 支持多字段(数值列、文本列)的模式挖掘。

限制说明

  • 输入的时序数据必须是基于相同时间间隔的采样数据。
  • 输入的时序数据中不能含有重复时间点的数据。
限制项 说明
时序数据处理的有效容量 上限为150,000个连续时间点数据。

若数量超过上限,请进行聚合操作或者降采样。

密度聚类算法的聚类容量 上限为5000条时序曲线,每条时序曲线的长度最大为1440个点。
层次聚类算法的聚类容量 上限为2000条时序曲线,每条时序曲线的长度最大为1440个点。

机器学习函数

类别 函数 说明
时间序列 平滑函数 ts_smooth_simple 使用Holt Winters算法对时序数据平滑。
ts_smooth_fir 使用FIR滤波器对时序数据平滑。
ts_smooth_iir 使用IIR滤波器对时序数据平滑。
多周期估计函数 ts_period_detect 对时序数据进行分段周期估计。
变点检测函数 ts_cp_detect 寻找时序序列中具有不同统计特性的区间,区间端点即为变点。
ts_breakout_detect 寻找时序序列中,某统计量发生陡升或陡降的点。
极大值检测函数 ts_find_peaks 极大值检测函数用于在指定窗口中寻找序列的局部极大值。
预测与异常检测函数 ts_predicate_simple 利用默认参数对时序数据进行建模,并进行简单的时序预测和异常点的检测。
ts_predicate_ar 使用自回归模型对时序数据进行建模,并进行简单的时序预测和异常点的检测。
ts_predicate_arma 使用移动自回归模型对时序数据进行建模,并进行简单的时序预测和异常点检测。
ts_predicate_arima 使用带有差分的移动自回归模型对时序数据进行建模,并进行简单的时序预测和异常点检测。
ts_regression_predict 针对含有周期性、趋势性的单时序序列,进行准确且长时序预测。
序列分解函数 ts_decompose 使用STL算法对时序数据进行序列分解。
时序聚类函数 ts_density_cluster 使用密度聚类方法对多条时序数据进行聚类。
ts_hierarchical_cluster 使用层次聚类方法对多条时序数据进行聚类。
ts_similar_instance 查找到指定曲线名称的相似曲线。
模式挖掘 频繁模式统计 pattern_stat 统计模式中的频繁模式,在给定的多属性字段样本中,挖掘出具有一定代表性的属性组合。
差异模式统计 pattern_diff 在指定条件下找出导致两个集合差异的模式。
根因分析函数 rca_kpi_search 在时序指标发生异常时,根因分析函数可以快速分析出是哪些相关维度属性发生异常而导致监控指标发生异常。
相关性分析函数 ts_association_analysis 针对系统中的多个观测指标,快速找出和某个指标项相关的指标名称。
ts_similar 针对系统中的多个观测指标,快速找出和用户输入的时序序列相关的指标名称。