本文为您介绍PAI-Studio提供的单样本T检验。

单样本T检验旨在检验某个变量的总体均值与某个指定值之间是否存在显著差异,其检验的样本必须总体服从正态分布。
  • 可视化方式
    页签 参数 描述
    字段设置 样本1所在列 进行训练的样本1所在列。
    参数设置 对立假设类型 对立假设的类型。
    置信度 检测结果的置信度。
    假设均值大小 假设均值的大小。
    两总体方差是否相等 两个总体值的方差是否相等。可选true或者false。
    节点个数 节点个数,正整数格式。
    单个节点内存大小 每个节点的内存大小。取值范围1 MB~65536 MB。
  • PAI命令方式
    pai -name t_test -project algo_public
        -DxTableName=pai_t_test_all_type
        -DxColName=col1_double
        -DoutputTableName=pai_t_test_out
        -DxTablePartitions=ds=2010/dt=1
        -Dalternative=less
        -Dmu=47
        -DconfidenceLevel=0.95
    参数 是否必须 描述 默认值
    xTableName 表名称
    xColName 需要进行T检验的列
    outputTableName 输出表名称
    xTablePartitions 表的分区列表
    alternative 对立假设。取值包括:two.sided、less、greater。 two.sided
    mu 假设的均值 0
    confidenceLevel 置信度。取值包括:0.8、0.9、0.95、0.99、0.995、0.999。 0.95

输出说明

输出一个一行一列的JSON格式表。
{
    "AlternativeHypthesis": "mean not equals to 0",
    "ConfidenceInterval": "(44.72234194006504, 46.27765805993496)",
    "ConfidenceLevel": 0.95,
    "alpha": 0.05,
    "df": 99,
    "mean": 45.5,
    "p": 0,
    "stdDeviation": 3.919647479510927,
    "t": 116.081867662439
}