本文介绍写数据表算子的使用方法。
用途
写数据表算子用于将模型上游节点处理之后的出具写入指定的数据表中。
适用场景
计算链路 | 计算引擎 | 是否支持 |
离线 | MaxCompute | 是 |
Hive | 是 | |
HiveStorage | 是 | |
RDS/MySQL | 是 |
使用说明
离线链路
输入节点
查看上游节点输入到当前节点的字段情况。
数据同步
配置将上游输出的数据,同步到的目标数据表。
计算资源类型
选择需要同步到的目标数据源的类型,目前支持的目标数据源类型参见适用场景
目标数据源
选择同步到的目标数据源。
目标数据表
选择同步到的目标数据源中的表名。
生命周期(可选)
设置目标表的留存天数,如未设置,默认将保留1天。
说明
生命周期决定了目标表在多长时间之后被自动删除。
比如设置了生命周期为1天,则表在1天后会被自动删除。特别注意,并不会精确到24小时的时候删除,可能会在到期当天的某个时间点删除。
字段列表
配置输出到目标表的字段列表。
可在字段列表中对上游的输出字段的信息进行修改,比如:对字段重命名、修改注释等。
同步模式
全表同步:先清空目标表里已有数据,然后重新插入新数据。
增量同步:保留目标表中的已有数据,然后追加插入新数据。
分区同步:向目标表的指定分区中重新插入新数据。仅对支持分区的计算资源有效。
说明
同步的目标表在目标计算引擎中如果存在相同名称的表,如果目标表的结构与已存在表的结构一致,则同步将正常运行。如果不一致则将抛出异常,需要用户自行处理。
文档内容是否对您有帮助?