本文介绍字段加工算子的使用方法和注意事项。
用途
字段加工算子可以将节点的数据进行逻辑加工,然后作为输出字段在之后的节点使用。
适用场景
计算链路 | 计算引擎 | 是否支持 |
离线 | MaxCompute | 是 |
Hive | 是 | |
HiveStorage | 是 | |
RDS/MySQL | 是 |
使用说明
加工逻辑
对于需要加工的字段,需要输入字段名称和字段代码,以及字段内容类型,如文本、长文本、整型、小时、时间、布尔等。然后再配置加工的逻辑,比如从身份证号中提取性别等。
对应加工逻辑,支持“当……时……否则……”这种逻辑方式进行配置,比如加工成绩评价字段,“当 ‘语文成绩>90’ 时 ‘优秀’ 否则 ‘良好’”。
如果需要加工多个字段,点击新增字段或者复制按钮,然后再配置编辑。
输出字段
输出的字段默认继承上个节点的输出,在经过这个算子之后,可以配置需要输出到下个节点的字段。
输出的字段可以设置别名和代码别名,之后的节点就会使用别名和代码别名。
结果排序
对于输出的结果可以配置排序,有升序和降序,排序的内容支持多个,比如按照年龄升序,并且按照语文成绩降序,并且排序内容支持表达式配置。
对于节点输出的数据支持截取,比如从第100条开始,截取1000条。
说明
只有离线场景才有此功能。
注意事项
新加的字段代码不允许重复。
新加的字段数据类型和加工结果数据类型得保持一致。
文档内容是否对您有帮助?