Azure Blob Storage数据源为您提供读取文件的能力,您可以使用本数据源,获取Azure Blob Storage中存储的文件,解析并同步至任意目标数据源。本文为您介绍DataWorks的Azure Blob Storage数据同步的能力支持情况。
使用限制
支持的字段类型
Azure Blob Stoage数据源,提供了以下数据类型。
数据类型 | 说明 |
STRING | 文本类型。 |
LONG | 整型。 |
BYTES | 字节数组,将读取到的文本内容转为UTF-8编码的字节数组。 |
BOOL | 布尔型。 |
DOUBLE | 浮点型。 |
DATE | 日期时间类型,支持以下日期时间格式:
|
创建数据源
在进行数据同步任务开发之前,您需要在DataWorks上创建Azure Blob Storage数据源,具体操作流程请参见创建并管理数据源。详细的配置参数解释可在配置界面查看对应参数的文案提示。
数据同步任务开发
单表离线同步任务配置指导
操作流程请参见通过向导模式配置离线同步任务、通过脚本模式配置离线同步任务。
脚本模式配置的全量参数和脚本Demo,请参见下文附录:Azure Blob Storage脚本Demo与参数说明。
附录:Azure Blob Storage脚本Demo与参数说明
离线任务脚本配置方式
如果您配置离线任务时使用脚本模式的方式进行配置,您需要在任务脚本中按照脚本的统一格式要求编写脚本中的Reader参数,脚本模式的统一要求请参见通过脚本模式配置离线同步任务,以下为您介绍脚本模式下的数据源的Reader参数的指导详情。
Azure Blob Storage Reader脚本Demo
Azure Blob Storage Reader脚本参数
文档内容是否对您有帮助?