本文为您介绍AnalyticDB for MySQL 3.0 Writer支持的数据类型、字段映射和数据源等参数及配置示例。
开始配置AnalyticDB for MySQL 3.0 Writer插件前,请先配置好数据源,详情请参见配置AnalyticDB for MySQL 3.0数据源。
类型转换列表
AnalyticDB for MySQL 3.0 Writer针对AnalyticDB for MySQL 3.0类型的转换列表,如下所示。
类型 | AnalyticDB for MySQL 3.0数据类型 |
---|---|
整数类 | INT、INTEGER、TINYINT、SMALLINT和BIGINT |
浮点类 | FLOAT、DOUBLE和DECIMAL |
字符串类 | VARCHAR |
日期时间类 | DATE、DATETIME、TIMESTAMP和TIME |
布尔类 | BOOLEAN |
参数说明
参数 | 描述 | 是否必选 | 默认值 |
---|---|---|---|
datasource | 数据源名称,脚本模式支持添加数据源,此配置项填写的内容必须与添加的数据源名称保持一致。 | 是 | 无 |
table | 选取的需要同步的表名称。 | 是 | 无 |
writeMode | 选择导入模式,可以支持insert 和replace 两种方式。
|
否 | insert |
column | 目标表需要写入数据的字段,字段之间用英文所逗号分隔,例如"column": ["id", "name", "age"] 。如果要依次写入全部列,使用*表示, 例如"column": ["*"] 。
说明 如果字段名中包含select,请在字段名前后加上反引号。例如,item_select_no需要写为`item_select_no`。
|
是 | 无 |
preSql | 执行数据同步任务之前率先执行的SQL语句。目前向导模式仅允许执行一条SQL语句,脚本模式可以支持多条SQL语句,例如清除旧数据。
说明 当有多条SQL语句时,不支持事务。
|
否 | 无 |
postSql | 执行数据同步任务之后执行的SQL语句,目前向导模式仅允许执行一条SQL语句,脚本模式可以支持多条SQL语句,例如加上某一个时间戳。
说明 当有多条SQL语句时,不支持事务。
|
否 | 无 |
batchSize | 一次性批量提交的记录数大小,该值可以极大减少数据同步系统与MySQL的网络交互次数,并提升整体吞吐量。如果该值设置过大,会导致数据同步运行进程OOM异常。 | 否 | 1,024 |
向导开发介绍
- 选择数据源。
配置同步任务的数据来源和数据去向。
参数 描述 数据源 即上述参数说明中的datasource,通常填写您配置的数据源名称。 表 即上述参数说明中的table。 导入前准备语句 即上述参数说明中的preSql,输入执行数据同步任务之前率先执行的SQL语句。 导入后完成语句 即上述参数说明中的postSql,输入执行数据同步任务之后执行的SQL语句。 主键冲突 即上述参数说明中的writeMode,可以选择需要的导入模式。 批量插入条数 即上述参数说明中的batchSize,提交数据写的批量条数,当wirteMode为insert时,该值才会生效。 - 字段映射,即上述参数说明中的column,左侧的源头表字段和右侧的目标表字段为一一对应的关系。
- 通道控制。
参数 描述 任务期望最大并发数 数据同步任务内,可以从源并行读取或并行写入数据存储端的最大线程数。向导模式通过界面化配置并发数,指定任务所使用的并行度。 同步速率 设置同步速率可以保护读取端数据库,以避免抽取速度过大,给源库造成太大的压力。同步速率建议限流,结合源库的配置,请合理配置抽取速率。 错误记录数 错误记录数,表示脏数据的最大容忍条数。 分布式处理能力 数据同步时,可以将任务切片分散到多台执行节点上并发执行,提高同步速率。该模式下,配置较大任务并发数会增加数据存储访问压力,如需使用该功能,请提前评估数据存储的访问负载。该功能仅支持在独享数据集成资源组配置,详情请参见独享数据集成资源组和新增和使用独享数据集成资源组。
脚本开发介绍
通过脚本模式开发的详情请参见通过脚本模式配置任务。
脚本配置示例如下,详情请参见上述参数说明。
注意 实际运行时,请删除下述代码中的注释。
{
"type": "job",
"steps": [
{
"stepType": "stream",
"parameter": {},
"name": "Reader",
"category": "reader"
},
{
"stepType": "analyticdb_for_mysql", //插件名。
"parameter": {
"postSql": [], //导入后的准备语句。
"tableType": null, //保留字段,默认空。
"datasource": "hangzhou_ads", //数据源名称。
"column": [ //同步字段。
"id",
"value"
],
"guid": null,
"writeMode": "insert", //写入模式,请参见writeMode参数说明。
"batchSize": 2048, //批量写入的大小,请参见batchSize参数说明。
"encoding": "UTF-8", //编码格式。
"table": "t5", //写入的表名。
"preSql": [] //导入前的准备语句。
},
"name": "Writer",
"category": "writer"
}
],
"version": "2.0", //配置文件格式的版本号。
"order": {
"hops": [
{
"from": "Reader",
"to": "Writer"
}
]
},
"setting": {
"errorLimit": {
"record": "0" //错误记录数。
},
"speed": {
"throttle":true,//当throttle值为false时,mbps参数不生效,表示不限流;当throttle值为true时,表示限流。
"concurrent":2, //作业并发数。
"mbps":"12"//限流
}
}
}