PolarDB数据源为您提供读取和写入PolarDB双向通道的功能,您可以通过向导模式和脚本模式配置同步任务。
使用限制
离线读写
支持读取视图表。
实时读
来源数据源为阿里云PolarDB MySQL时,您需要开启Binlog。阿里云PolarDB MySQL是一款完全兼容MySQL的云原生数据库,默认使用了更高级别的物理日志代替Binlog,但为了更好地与MySQL生态融合,PolarDB支持开启Binlog的功能。
支持的字段类型
离线读
PolarDB Reader针对PolarDB类型的转换列表,如下所示。
类型分类 | PolarDB数据类型 |
整数类 | INT、TINYINT、SMALLINT、MEDIUMINT和BIGINT |
浮点类 | FLOAT、DOUBLE和DECIMAL |
字符串类 | VARCHAR、CHAR、TINYTEXT、TEXT、MEDIUMTEXT和LONGTEXT |
日期时间类 | DATE、DATETIME、TIMESTAMP、TIME和YEAR |
布尔型 | BIT和BOOL |
二进制类 | TINYBLOB、MEDIUMBLOB、BLOB、LONGBLOB和VARBINARY |
除上述罗列字段类型外,其它类型均不支持。
PolarDB Reader插件将tinyint(1)视作整型。
离线写
类似于PolarDB Reader ,目前PolarDB Writer支持大部分PolarDB类型,但也存在部分类型没有支持的情况,请注意检查您的数据类型。
PolarDB Writer针对PolarDB类型的转换列表,如下所示。
类型分类 | PolarDB数据类型 |
整数类 | INT、TINYINT、SMALLINT、MEDIUMINT、BIGINT和YEAR |
浮点类 | FLOAT、DOUBLE和DECIMAL |
字符串类 | VARCHAR、CHAR、TINYTEXT、TEXT、MEDIUMTEXT和LONGTEXT |
日期时间类 | DATE、DATETIME、TIMESTAMP和TIME |
布尔型 | BOOL |
二进制类 | TINYBLOB、MEDIUMBLOB、BLOB、LONGBLOB和VARBINARY |
数据同步前准备
准备工作1:配置白名单
将Serverless资源组或独享数据集成资源组所在的VPC网段添加至OceanBase的白名单中,详情请参见添加白名单。
准备工作2:创建账号并配置账号权限
创建账号并配置账号权限。
您需要规划一个数据库的登录账户用于后续执行操作,此账户需拥有数据库的 SELECT, REPLICATION SLAVE, REPLICATION CLIENT
权限。
创建账号。
操作详情可参见创建和管理数据库账号。
配置权限。
您可参考以下命令为账号添加此权限,或直接给账号赋予
SUPER
权限。-- CREATE USER '同步账号'@'%' IDENTIFIED BY '同步账号'; GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO '同步账号'@'%';
准备工作3:开启PolarDB的开启Binlog
操作详情可参见开启Binlog。
创建数据源
在进行数据同步任务开发时,您需要在DataWorks上创建一个对应的数据源,操作流程请参见创建并管理数据源,详细的配置参数解释可在配置界面查看对应参数的文案提示。
数据同步任务开发:PolarDB同步流程引导
数据同步任务的配置入口和通用配置流程可参见下文的配置指导。
单表离线同步任务配置指导
操作流程请参见通过向导模式配置离线同步任务、通过脚本模式配置离线同步任务。
脚本模式配置的全量参数和脚本Demo请参见下文的附录:脚本Demo与参数说明。
单表、整库实时同步任务配置指导
操作流程请参见DataStudio侧实时同步任务配置。
整库离线读、单表/整库全增量实时读同步任务配置指导
操作流程请参见数据集成侧同步任务配置。
常见问题
附录:脚本Demo与参数说明
离线任务脚本配置方式
如果您配置离线任务时使用脚本模式的方式进行配置,您需要按照统一的脚本格式要求,在任务脚本中编写相应的参数,详情请参见通过脚本模式配置离线同步任务,以下为您介绍脚本模式下数据源的参数配置详情。