一键同步MaxCompute数据
本文为您介绍如何使用HoloStudio导入MaxCompute数据至Hologres。
HoloStudio已下线,详情请参见DataWorks HoloStudio下线公告。
前提条件
阿里云账号注册,详情请参见阿里云账号注册流程。
开通实时数仓Hologres并绑定至DataWorks工作空间,详情请参见DataWorks快速入门。
背景信息
HoloStudio支持一键MaxCompute数据同步功能,您可以使用可视化方式导入MaxCompute表数据并进行查询。该方式比创建外部表直接查询数据的性能更好。
您也可以使用SQL语句导入MaxCompute数据,详情请参见使用SQL从MaxCompute导入。
操作步骤
登录阿里云官网。
新建一键MaxCompute数据同步节点。
在页面上方选择目标地域。
在左侧菜单栏单击前往DataStudio,前往DataWorks-HoloStudio开发。
在Holo Studio页面的左侧导航栏,单击图标。
进入数据开发页面,鼠标悬停至顶部菜单栏的图标。
单击一键MaxCompute数据同步。
在新建节点对话框中,输入节点名称,并选择目标文件夹和数据库。
单击提交。
在编辑节点页面,配置各项参数。
参数
描述
外部表来源
已有外部表:表示在Hologres中已经建立MaxCompute数据映射的外部表。
新建外部表:表示外部表在Hologres中未建立MaxCompute数据映射。如果您需要导入MaxCompute表数据,请选中新建外部表。
外部表表名字
已创建的外部表表名称。
Hologres中创建的外部表用于映射MaxCompute数据,需要与导入数据的MaxCompute表结构一一对应。
目标库
Hologres的数据库名称。
目标Schema
当前数据库的Schema名称。
如果您没有新建Schema,则只能选择默认创建的public。如果有新建的Schema,您也可以选择新建的Schema。
目标表名
需要导入数据的表名称。
目标表描述
目标表的信息描述。
同步字段
需要导入的MaxCompute表字段。
您可以选择导入部分或全部字段。
分区配置
需要导入的分区字段。
一键MaxCompute数据同步功能仅支持导入一级分区。如果您需要导入多级分区,请在SQL Console中使用SQL语句实现,详情请参见SQL Console。
索引配置
您可以为目标表创建索引,详情请参见CREATE TABLE。
SQL Script
自动解析当前可视化操作对应的SQL语句。
在新建节点的编辑页面,单击图标,保存配置信息。
在新建节点的编辑页面,单击图标,导入MaxCompute表数据。
在PG管理页面,查看导入的外部表数据,详情请参见创建及管理外部表或SQL Console。