本文为您介绍PAI-Designer(原PAI-Studio)提供的单样本T检验。单样本T检验旨在检验某个变量的总体均值与某个指定值之间是否存在显著差异,其检验的样本必须总体服从正态分布。

组件配置

您可以使用以下任意一种方式,配置单样本T检验组件参数。

方式一:可视化方式

在PAI-Designer(原PAI-Studio)工作流页面配置组件参数。
页签 参数 描述
字段设置 样本1所在列 进行训练的样本1所在列。
参数设置 对立假设类型 对立假设的类型。
置信度 检测结果的置信度。
假设均值大小 假设均值的大小。
两总体方差是否相等 两个总体值的方差是否相等。可选true或者false。
节点个数 节点个数,正整数格式。
单个节点内存大小 每个节点的内存大小。取值范围1 MB~65536 MB。

方式二:PAI命令方式

使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI命令调用,详情请参见SQL脚本
pai -name t_test -project algo_public
    -DxTableName=pai_t_test_all_type
    -DxColName=col1_double
    -DoutputTableName=pai_t_test_out
    -DxTablePartitions=ds=2010/dt=1
    -Dalternative=less
    -Dmu=47
    -DconfidenceLevel=0.95
参数 是否必须 描述 默认值
xTableName 表名称
xColName 需要进行T检验的列
outputTableName 输出表名称
xTablePartitions 表的分区列表
alternative 对立假设。取值包括:two.sided、less、greater。 two.sided
mu 假设的均值 0
confidenceLevel 置信度。取值包括:0.8、0.9、0.95、0.99、0.995、0.999。 0.95

输出说明

输出一个一行一列的JSON格式表。
{
    "AlternativeHypthesis": "mean not equals to 0",
    "ConfidenceInterval": "(44.72234194006504, 46.27765805993496)",
    "ConfidenceLevel": 0.95,
    "alpha": 0.05,
    "df": 99,
    "mean": 45.5,
    "p": 0,
    "stdDeviation": 3.919647479510927,
    "t": 116.081867662439
}