字段加工

本文介绍字段加工算子的使用方法和注意事项。

用途

字段加工算子可以将节点的数据进行逻辑加工,然后作为输出字段在之后的节点使用。

适用场景

计算链路

计算引擎

是否支持

离线

MaxCompute

Hive

HiveStorage

RDS/MySQL

使用说明

加工逻辑

对于需要加工的字段,需要输入字段名称和字段代码,以及字段内容类型,如文本、长文本、整型、小时、时间、布尔等。然后再配置加工的逻辑,比如从身份证号中提取性别等。

对应加工逻辑,支持“当……时……否则……”这种逻辑方式进行配置,比如加工成绩评价字段,“当 ‘语文成绩>90’ 时 ‘优秀’ 否则 ‘良好’”。

如果需要加工多个字段,点击新增字段或者复制按钮,然后再配置编辑。

输出字段

输出的字段默认继承上个节点的输出,在经过这个算子之后,可以配置需要输出到下个节点的字段。

输出的字段可以设置别名和代码别名,之后的节点就会使用别名和代码别名。

结果排序

对于输出的结果可以配置排序,有升序和降序,排序的内容支持多个,比如按照年龄升序,并且按照语文成绩降序,并且排序内容支持表达式配置。

对于节点输出的数据支持截取,比如从第100条开始,截取1000条。

说明

只有离线场景才有此功能。

注意事项

  1. 新加的字段代码不允许重复。

  2. 新加的字段数据类型和加工结果数据类型得保持一致。