本文为您介绍如何使用HoloStudio批量创建外部表。
前提条件
阿里云账号注册,详情请参见阿里云账号注册流程。
开通实时数仓Hologres并绑定至DataWorks工作空间,详情请参见DataWorks快速入门。
背景信息
Hologres与MaxCompute在底层无缝连接,支持使用新建外部表的方式加速查询MaxCompute的数据,详情请参见通过创建外部表加速查询MaxCompute数据。
HoloStudio支持一键MaxCompute表结构同步功能,您可以使用可视化方式批量创建外部表。
您也可以使用IMPORT FOREIGN SCHEMA
语句批量创建外部表。也可以将该命令语句在数据开发中执行,并前往调度,实现MaxCompute表新增后Hologres外表也自动新增,详情见Hologres开发:周期性调度。
Hologres只能加速查询MaxCompute的内表,不能加速查询MaxCompute的外表和View。
操作步骤
登录阿里云官网。
新建一键MaxCompute表结构同步节点。
在页面上方选择目标地域。
在左侧菜单栏单击前往DataStudio,前往DataWorks-HoloStudio开发。
在Holo Studio界面的左侧导航栏,单击图标。
进入数据开发页面,鼠标悬停至顶部菜单栏的图标。
单击一键MaxCompute表结构同步。
在新建节点对话框中,输入节点名称,并选择目标文件夹和数据库。
单击提交。
在编辑节点页面,配置各项参数。
参数
描述
目标库
Hologres的数据库名称。
目标Schema
当前数据库的Schema名称。
如果您没有新建Schema,则只能选择默认创建的public。如果有新建的Schema,您也可以选择新建的Schema。
远程服务类型
默认为odps。
目前仅支持MaxCompute。
远程服务器
您可以直接调用Hologres底层已创建的名为odps_server的远程服务器。详细原理请参见Postgres FDW。
远程库
MaxCompute的项目名称。
表名规则
您可以使用正则表达式选择需要同步的表名称,默认同步远程数据库中的所有表。更多筛选外部表的规则请参见IMPORT FOREIGN SCHEMA。
正则预览
查看正则表达式的运行结果。
同步外部表的规则如下:
如果同步外部表时存在名称相同的表,则忽略当前表。
如果同步外部表时,存在外部表不支持的数据类型,则系统会报错请在正则表达式中排除当前表再重新导入。
在新建节点的编辑页面,单击图标,保存配置信息。
在新建节点的编辑页面,单击图标,批量创建外部表结构。
在PG管理页面,查看批量创建的外部表并查询表数据,详情请参见创建及管理外部表。