文档

核密度估计函数

更新时间:

核密度估计(Kernel Density Estimation)在概率论中用来估计未知的密度函数,属于非参数检验方法之一。

核密度估计函数采用平滑的峰值函数来拟合观察到的数据点,从而对真实的概率分布曲线进行模拟。

  • 函数格式

    select kernel_density_estimation(bigint stamp, double value, varchar kernelType)
  • 参数说明

    参数

    说明

    stamp

    UnixTime 时间戳数据,单位为秒。

    value

    对应的观测数值。

    kernelType

    • box:矩形。

    • epanechnikov:Epanechnikov 曲线。

    • gaussian:高斯曲线。

  • 输出结果

    显示项

    说明

    unixtime

    对应原始数据的时间戳数据。

    real

    对应的观测数值。

    pdf

    对应的每个观测点的概率值。

  • 示例

    • 代码示例:

      * | 
      select 
          date_trunc('second', cast(t1[1] as bigint)) as time, t1[2] as real, t1[3] as pdf from (
              select kernel_density_estimation(time, num, 'gaussian') as res from ( 
                  select '("__time__" - ("__time__" % 10))' as time, COUNT(*) * 1.0 as num from log group by time order by time)
              ), unnest(res) as t(t1)  limit 1000
    • 结果示例:

  • 本页导读 (1)