核密度估计(Kernel Density Estimation)在概率论中用来估计未知的密度函数,属于非参数检验方法之一。
核密度估计函数采用平滑的峰值函数来拟合观察到的数据点,从而对真实的概率分布曲线进行模拟。
- 函数格式 - select kernel_density_estimation(bigint stamp, double value, varchar kernelType)
- 参数说明 - 参数 - 说明 - stamp - UnixTime 时间戳数据,单位为秒。 - value - 对应的观测数值。 - kernelType - box:矩形。 
- epanechnikov:Epanechnikov 曲线。 
- gaussian:高斯曲线。 
 
- 输出结果 - 显示项 - 说明 - unixtime - 对应原始数据的时间戳数据。 - real - 对应的观测数值。 - pdf - 对应的每个观测点的概率值。 
- 示例 - 代码示例: - * | select date_trunc('second', cast(t1[1] as bigint)) as time, t1[2] as real, t1[3] as pdf from ( select kernel_density_estimation(time, num, 'gaussian') as res from ( select '("__time__" - ("__time__" % 10))' as time, COUNT(*) * 1.0 as num from log group by time order by time) ), unnest(res) as t(t1) limit 1000
- 结果示例:  
 
该文章对您有帮助吗?