流式统计算法异常检测针对输入的时序曲线进行统计分析,通过累积数据的分布,判断当前数据的异常程度。

适用场景

流式统计算法异常检测适用于时序数据变点异常检测。适用场景

参数说明

您在创建数据加工规则时,可在模型参数配置中选择流式统计算法异常检测,用于检测时序数据的变点异常。流式统计
流式统计算法异常检测相关参数说明如下表所示。
参数 说明
时间列 时间字段,该字段所对应的值为Unix时间戳。

只支持索引类型为long类型的字段。

时间粒度 数据写入的粒度,即同一个实例中最小的数据间隔,单位:秒。
实例列 选择实例列,该字段标记了一条时序曲线的名称。支持多选。

只支持索引类型为text类型的字段。

选择数值列 对应某时刻的数据。
上界 自定义阈值,如果您所选择的数值列的值大于该值,则直接判断为异常。
下界 自定义阈值,如果您所选择的数值列的值小于该值,则直接判断为异常。
算法类型 选择流式统计算法异常检测
仅保留异常结果 开启仅保留异常结果开关后,只保留异常结果到目标Logstore中。
算法检测间隔 指定发起算法检测异常的时间间隔,该值需小于等于时间粒度,单位:秒。

输出结果

流式统计算法将异常程度量化为具体的分数,并写入到您指定的目标LogStore中。您可根据业务需求设置告警。 输出结果
类型 字段 说明
entiy 无固定字段 表示一条时序曲线的实例列信息。
meta project_name 时序数据来源的Project。
logstore_name 时序数据来源的LogStore。
results dim_name 您所指定的数值列。
is_anomaly 流式统计算法判断时序数据是否异常,Bool类型。

流式统计算法默认以0.75为界线,如果score值大于0.75,则为异常,显示为true。

score 流式统计算法输出的异常程度的量化分数,范围为[0,1],分数越大越异常。此外,-1表示数据缺失,-2表示疑似异常(可能是因为流式统计算法还未学习充分)。