文档

字符串替换

更新时间:

DataWorks数据集成实时ETL支持字符串替换组件使用,可以在来源与去向组件间新增字符串替换组件,对字符串进行替换。

前提条件

  • 已完成数据集成的基本配置与网络资源配置。

  • 数据集成的同步类型为单表实时。

步骤一:配置数据集成任务

  1. 新建数据源,详情请参见:创建并管理数据源

  2. 新建数据集成任务,详情请参见:数据集成侧同步任务

    说明

    当数据集成侧同步任务的同步类型为单表实时,可在数据来源组件与数据去向组件之间新增数据处理组件。详情可参见支持的数据源及同步方案

步骤二:添加字符串替换组件

  1. 在实时ETL任务编辑页DAG画布中,单击来源去向组件之间的image按钮,新增选择字符串替换组件。

  2. 配置替换规则

    将命中规则的数据替换成新的字符串。

    • 规则配置

      • 字段名:选择前一个步骤的文本类型输入字段。

      • 原字符串:查找的原字符串,当关闭正则匹配时,支持Java转义字符,例如\t(制表符)、\n(换行符)、\u0001(unicode字符)。

      • 新字符串:替换后的新字符串,当关闭正则匹配时,支持Java转义字符,例如\t(制表符)、\n(换行符)、\u0001(unicode字符)

      • 检索时:可配置正则匹配与大小写敏感。

      说明
      • 正则匹配:是否启用正则表达式匹配,开启正则匹配时,原字符串支持的正则表达式规则参考Class Pattern,新字符串替换支持使用$+数字引用正则表达式中的分组,例如字段内容为no.9526,原字符串配置no.([0-9]+),新字符串配置$1,则替换后的字段内容为9526

      • 大小写敏感:原字符串查找是否大小写敏感。

      image

    • 添加条件:单击添加条件可新增一条规则。

    • 输出字段:来源数据替换后的输出字段名,与输入字段名和格式一致。

后续操作

完成来源信息字符串替换以及去向信息的配置后,可单击右上角的模拟运行,对数据集成任务进行模拟运行,以便查看输出数据结果,是否符合您的需求。