本文为您介绍Oracle Writer支持的数据类型、写入方式、字段映射和数据源等参数及配置示例。
Oracle Writer插件实现了写入数据到Oracle主库的目标表的功能。在底层实现上,Oracle Writer通过JDBC连接远程Oracle数据库,并执行相应的
insert into...
SQL语句,将数据写入Oracle。
说明
- 开始配置Oracle Writer插件前,请首先配置好数据源,详情请参见配置Oracle数据源。
- Oracle Writer插件使用ojdbc6-12.1.1.jar驱动,支持的Oracle版本请参见Oracle官网。
Oracle Writer面向ETL开发工程师,使用Oracle Writer从数仓导入数据至Oracle。同时Oracle Writer也可以作为数据迁移工具,为数据库管理员等用户提供服务。
Oracle Writer通过数据同步框架获取Reader生成的协议数据,然后通过JDBC连接远程Oracle数据库,并执行相应的SQL语句,将数据写入Oracle。
支持的Oracle版本
版本 | 是否支持 |
---|---|
Oracle 11.2 or 11gR2 | 是 |
Oracle 12.1 or 12cR1 | 是 |
Oracle 12.2 or 12cR2 | 是(新版本特性不支持) |
Oracle 18.3 | 是(新版本特性不支持) |
Oracle 19.x | 是(新版本特性不支持) |
Oracle 21.1 | 是(新版本特性不支持) |
支持的字段类型
字段类型 | 离线读(Oracle Reader) | 离线写(Oracle Writer) | 实时读 |
---|---|---|---|
NUMBER | 支持 | 支持 | 支持 |
BINARY FLOAT | 支持 | 支持 | 支持 |
BINARY DOUBLE | 支持 | 支持 | 支持 |
CHAR | 支持 | 支持 | 支持 |
NCHAR | 支持 | 支持 | 支持 |
VARCHAR2 | 支持 | 支持 | 支持 |
NVARCHAR2 | 支持 | 支持 | 支持 |
DATE | 支持 | 支持 | 支持 |
TIMESTAMP | 支持 | 支持 | 支持 |
TIMESTAMP WITH TIME ZONE | 支持 | 支持 | 支持 |
TIMESTAMP WITH LOCAL TIME ZONE | 支持 | 支持 | 支持 |
CLOB | 支持 | 支持 | 支持 |
BLOB | 支持 | 支持 | 支持 |
RAW | 支持 | 支持 | 支持 |
ROWID | 不支持 | 不支持 | 支持 |
UROWID | 不支持 | 不支持 | 支持 |
FLOAT | 支持 | 支持 | 支持 |
INTERVAL DAY TO SECOND | 不支持 | 不支持 | 支持 |
INTERVAL YEAR TO MONTH | 不支持 | 不支持 | 支持 |
BFILE | 不支持 | 不支持 | 不支持 |
LONG | 不支持 | 不支持 | 不支持 |
LONG RAW | 不支持 | 不支持 | 不支持 |
NCLOB | 支持 | 支持 | 不支持 |
STRUCT | 支持 | 支持 | 不支持 |
User-Defined Types | 不支持 | 不支持 | 不支持 |
AnyType | 不支持 | 不支持 | 不支持 |
AnyData | 不支持 | 不支持 | 不支持 |
AnyDataSet | 不支持 | 不支持 | 不支持 |
XmlType | 不支持 | 不支持 | 不支持 |
Spatial Types | 不支持 | 不支持 | 不支持 |
Media Types | 不支持 | 不支持 | 不支持 |
类型转换列表
Oracle Writer支持大部分Oracle类型,但也存在个别类型没有支持的情况,请注意检查您的数据类型。
Oracle Writer针对Oracle类型的转换列表,如下所示。
类型分类 | Oracle数据类型 |
---|---|
整数类 | NUMBER、RAWID、INTEGER、INT和SMALLINT |
浮点类 | NUMERIC、DECIMAL、FLOAT、DOUBLE PRECISION和REAL |
字符串类 | LONG、CHAR、NCHAR、VARCHAR、VARCHAR2、NVARCHAR2、CLOB、NCLOB、CHARACTER、CHARACTER VARYING、CHAR VARYING、NATIONAL CHARACTER、NATIONAL CHAR、NATIONAL CHARACTER VARYING、NATIONAL CHAR VARYING和NCHAR VARYING |
日期时间类 | TIMESTAMP和DATE |
布尔型 | BIT和BOOL |
二进制类 | BLOB、BFILE、RAW和LONG RAW |
参数说明
参数 | 描述 | 是否必选 | 默认值 |
---|---|---|---|
datasource | 数据源名称,脚本模式支持添加数据源,此配置项填写的内容必须要与添加的数据源名称保持一致。 | 是 | 无 |
table | 目标表名称,如果表的schema信息和上述配置username不一致,请使用schema.table的格式填写table信息。 | 是 | 无 |
writeMode | 选择导入模式,仅支持insert into。当主键或唯一性索引冲突时,会写不进去冲突的行,以脏数据的形式体现。 | 否 | insert into |
column | 目标表需要写入数据的字段,字段之间用英文逗号分隔。例如"column": ["id”,”name”,”age”] 。如果要依次写入全部列,使用*表示。例如"column":["*"] 。
|
是 | 无 |
preSql | 执行数据同步任务之前率先执行的SQL语句。目前向导模式仅允许执行一条SQL语句,脚本模式可以支持多条SQL语句,例如清除旧数据。 | 否 | 无 |
postSql | 执行数据同步任务之后执行的SQL语句。目前向导模式仅允许执行一条SQL语句,脚本模式可以支持多条SQL语句,例如加上某一个时间戳。 | 否 | 无 |
batchSize | 一次性批量提交的记录数大小,该值可以极大减少数据同步系统与MySQL的网络交互次数,并提升整体吞吐量。如果该值设置过大,会导致数据同步运行进程OOM异常。 | 否 | 1,024 |
向导开发介绍
- 选择数据源。
配置同步任务的数据来源和数据去向。
参数 描述 数据源 即上述参数说明中的datasource,通常填写您配置的数据源名称。 表 即上述参数说明中的table。 导入前准备语句 即上述参数说明中的preSql,输入执行数据同步任务之前率先执行的SQL语句。 导入后完成语句 即上述参数说明中的postSql,输入执行数据同步任务之后执行的SQL语句。 - 字段映射,即上述参数说明中的column,左侧的源头表字段和右侧的目标表字段为一一对应关系。
参数 描述 同名映射 单击同名映射,可以根据名称建立相应的映射关系,请注意匹配数据类型。 同行映射 单击同行映射,可以在同行建立相应的映射关系,请注意匹配数据类型。 取消映射 单击取消映射,可以取消建立的映射关系。 自动排版 可以根据相应的规律自动排版。 - 通道控制。
参数 描述 任务期望最大并发数 数据同步任务内,可以从源并行读取或并行写入数据存储端的最大线程数。向导模式通过界面化配置并发数,指定任务所使用的并行度。 同步速率 设置同步速率可以保护读取端数据库,以避免抽取速度过大,给源库造成太大的压力。同步速率建议限流,结合源库的配置,请合理配置抽取速率。 错误记录数 错误记录数,表示脏数据的最大容忍条数。 - 通道控制。
参数 描述 任务期望最大并发数 数据同步任务内,可以从源并行读取或并行写入数据存储端的最大线程数。向导模式通过界面化配置并发数,指定任务所使用的并行度。 同步速率 设置同步速率可以保护读取端数据库,以避免抽取速度过大,给源库造成太大的压力。同步速率建议限流,结合源库的配置,请合理配置抽取速率。 错误记录数 错误记录数,表示脏数据的最大容忍条数。 分布式处理能力 数据同步时,可以将任务切片分散到多台执行节点上并发执行,提高同步速率。该模式下,配置较大任务并发数会增加数据存储访问压力,如需使用该功能,请提前评估数据存储的访问负载。该功能仅支持在独享数据集成资源组配置,详情请参见独享数据集成资源组和新增和使用独享数据集成资源组。
脚本开发介绍
配置一个写入Oracle的作业,使用脚本进行开发的详情请参见通过脚本模式配置离线同步任务。
重要 实际运行时,请删除下述代码中的注释。
{
"type":"job",
"version":"2.0",//版本号。
"steps":[
{
"stepType":"stream",
"parameter":{},
"name":"Reader",
"category":"reader"
},
{
"stepType":"oracle",//插件名。
"parameter":{
"postSql":[],//执行数据同步任务之后执行的SQL语句。
"datasource":"",
"session":[],//数据库连接会话参数。
"column":[//字段。
"id",
"name"
],
"encoding":"UTF-8",//编码格式。
"batchSize":1024,//一次性批量提交的记录数大小。
"table":"",//表名。
"preSql":[]//执行数据同步任务之前执行的SQL语句。
},
"name":"Writer",
"category":"writer"
}
],
"setting":{
"errorLimit":{
"record":"0"//错误记录数。
},
"speed":{
"throttle":true,//当throttle值为false时,mbps参数不生效,表示不限流;当throttle值为true时,表示限流。
"concurrent":1, //作业并发数。
"mbps":"12"//限流
}
},
"order":{
"hops":[
{
"from":"Reader",
"to":"Writer"
}
]
}
}