自定义特征

本文为您介绍自定义特征组件。

功能说明

自定义特征组件可根据上传数据已有特征进行加减乘除处理后生成新的特征。在项目中,可以通过计算来生成优于原特征的新特征。

应用场景:已有特征x1、x2,需要新生成特征y1和y2,其中y1由“x1”与“x2乘3”求和生成,y2由x2除以x1生成,则应配置为:y1=x2*3,y1=y1+x1;y2=x2/x1

计算逻辑原理

自定义特征:通过已有特征之间加减乘除的计算生成新的特征。

参数说明

IN端口-输入参数

参数名

参数描述

是否必填

输入数据类型

数据源类型

特征变量

生成新特征需要的基础特征。

整数或浮点数

说明

若存在非数值数据,则会置为NaN。

  • CSV组件。

  • IGateInOffline组件。

  • 平台上其他数据处理组件。

  • 按照平台规范开发的自定义组件。

OUT端口-输出参数

参数名

参数描述

是否必填

输出

输出参数为新生成的特征。例如:已有特征x1、x2,需要新生成特征y1和y2,则输出参数为y1和y2。

其他参数

参数名

参数描述

是否必填

参数默认值

参数范围

特征生成规则

支持变量间的加减乘除(+-*/)。

新特征名称=生成条件,其中“生成条件”由+-*/和已有特征名称组成,不支持括号。

重要

可以同时生成多个新特征,不同新特征的生成条件之间用英文分号连接;每个特征可有多个步骤(单个步骤只能计算一次,能a+b,不能a+b*b),且步骤之间可用英文逗号连接,从左到右执行。使用示例:已有特征x1、x2,需要新生成特征y1和y2,其中y1由“x1”与“x2乘3”求和生成,y2由x2除以x1生成,则应配置为:y1=x2*3,y1=y1+x1;y2=x2/x1。