本文为您介绍PAI-Studio提供的协方差。

在概率论和统计学中,协方差用于衡量两个变量的总体误差。方差是协方差的一种特殊情况,即当两个变量是相同的情况。期望值分别为E(X) =μ与E(Y)=ν的两个实数,其随机变量X与Y之间的协方差定义为:cov(X, Y)=E((X - μ) (Y - ν))。

您可以通过以下任意一种方式,配置协方差组件参数:
  • 可视化方式
    页签 参数 描述
    字段设置 输入列 选择输入列,只支持bigint与double类型。
    进行调优 核心数 计算的核心数,如果未配置,则系统自动分配。
    内存数 每个核心的内存,如果未配置,则系统自动分配。单位为MB。
  • PAI命令方式
    PAI -name cov
        -project algo_public
        -DinputTableName=maple_test_cov_basic12x10_input
        -DoutputTableName=maple_test_cov_basic12x10_output
        -DcoreNum=6
        -DmemSizePerCore=110;
    参数名称 是否必须 描述 默认值
    inputTableName 输入表的名称。
    inputTablePartitions 输入表中,参与训练的分区。系统支持以下格式:
    • Partition_name=value
    • name1=value1/name2=value2:多级分区
    说明 指定多个分区时,分区之间使用英文逗号(,)分隔。
    输入表的所有分区
    outputTableName 输出表名称。
    selectedColNames 输入表选择列名类型。 选择全部列
    lifecycle 指定输出表的生命周期。
    coreNum 计算的核心数,取值范围为正整数。取值范围[1, 9999]。 默认自动计算
    memSizePerCore 每个核心的内存,取值范围为1 MB~65536 MB。 默认自动计算