文档

协方差

更新时间:

本文为您介绍Designer提供的协方差。

在概率论和统计学中,协方差用于衡量两个变量的总体误差。方差是协方差的一种特殊情况,即当两个变量是相同的情况。期望值分别为E(X) =μ与E(Y)=ν的两个实数,其随机变量X与Y之间的协方差定义为:cov(X, Y)=E((X - μ) (Y - ν))。

组件配置

您可以使用以下任意一种方式,配置协方差组件参数。

方式一:可视化方式

Designer工作流页面配置组件参数。

页签

参数

描述

字段设置

输入列

选择输入列,只支持bigint与double类型。

进行调优

核心数

计算的核心数,如果未配置,则系统自动分配。

内存数

每个核心的内存,如果未配置,则系统自动分配。单位为MB。

方式二:PAI命令方式

使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI命令调用,详情请参见SQL脚本

PAI -name cov
    -project algo_public
    -DinputTableName=maple_test_cov_basic12x10_input
    -DoutputTableName=maple_test_cov_basic12x10_output
    -DcoreNum=6
    -DmemSizePerCore=110;

参数名称

是否必须

描述

默认值

inputTableName

输入表的名称。

inputTablePartitions

输入表中,参与训练的分区。系统支持以下格式:

  • Partition_name=value

  • name1=value1/name2=value2:多级分区

说明

指定多个分区时,分区之间使用英文逗号(,)分隔。

输入表的所有分区

outputTableName

输出表名称。

selectedColNames

输入表选择列名类型。

选择全部列

lifecycle

指定输出表的生命周期。

coreNum

计算的核心数,取值范围为正整数。取值范围[1, 9999]。

默认自动计算

memSizePerCore

每个核心的内存,取值范围为1 MB~65536 MB。

默认自动计算

  • 本页导读 (1)