数据目录(新版)

数据目录是您在数据分析时统一的元数据工作台。它整合了MaxCompute、Hologres、DLF等多种数据源的元数据,让您无需离开DataWorks即可完成建表、视图管理等所有准备工作,从而专注核心分析。

功能入口

登录DataWorks数据分析,切换至目标地域后,单击进入数据分析页面。

  • 若在导航栏看到前往新版数据分析,单击切换进入新版数据分析页面。

  • 若在导航栏看到返回旧版数据分析,则表示已进入新版数据分析页面。

添加数据目录

若您之前未使用过数据分析,请参考新用户操作;否则,请参考老用户操作。

新用户添加数据目录

您可以根据个人需求来打造个性化的目录树,提升使用体验。具体操作如下:

  1. 进入数据目录后,找到需要添加的数据源类型,点击数据源类型名称后面的image图标,即可进入数据目录的添加页面。

  2. 在数据目录添加页面,您可以找到具体的实例或者数据源,单击对应实例或者数据源操作栏中的添加,即可将该实例或数据源添加到数据目录。

    若不再需要,将它移出即可。

老用户添加数据目录

支持您将系统推荐目录及已加入工作空间的数据源添加至目录。添加为目录后您可快速查看相应目录下数据表,支持查看表结构并快速生成查询SQL。

单击目录右上角的image按钮,进行添加目录。

  • 数据地图-元数据:数据地图中采集到的表元数据,每个数据源/计算资源即可添加成一个数据集。

  • 数据地图-数据专辑:数据地图中汇集某一些主题表的数据专辑,每个数据专辑即可添加成一个数据集。

  • 我的收藏:数据目录中我收藏的表。

  • 我的MaxCompute:当前登录账号是表Owner的所有MaxCompute表。

  • 公共数据:DataWorks提供的公开数据集,可用于快速生成测试SQL语句(支持EMR Spark SQL、MaxCompute、Hologres)。

  • 阿里云账单数据:您的阿里云账单数据,添加后可进行账单分析

说明

最多支持添加12个数据集,不需要的数据集可移除。

数据目录管理

重要

以下内容仅适用于新用户的数据目录。

使用数据目录管理表、视图、外表、资源及函数等数据对象。

生成查询SQL

基于数据表,快速生成查询SQL并完成配置与执行。如需了解更多操作可参见新建SQL查询

  1. 在数据目录的列表中找到目标数据源,依次单击左侧的image图标,从中定位到需要查询的目标表。

  2. 右键单击目标表,选择生成查询SQL

  3. 您可在生成的SQL编辑页面对生成的查询SQL脚本进行调整。

  4. 调整完成后可单击SQL编辑页右侧的运行配置,设置计算资源脚本参数等信息,然后执行查询语句。

附录说明

MaxCompute认证身份与鉴权

若使用RAM用户或RAM角色在数据目录中查看MaxCompute数据,需提前获取MaxCompute相关权限。如果添加的MaxCompute数据源或项目已开启三层模型,则还需为RAM账号或RAM角色授予查看Schema元数据的权限。

说明

MaxCompute项目中包含多个Schema,则需要授予所有Schema的元数据权限,才能在数据目录的项目详情页面查看完整的Schema列表。

  • 授权RAM用户

    GRANT DESCRIBE ON SCHEMA <Schema名> TO USER RAM$<主账号名>:<RAM用户名>;
  • 授权RAM角色

    GRANT DESCRIBE ON SCHEMA <Schema名> TO USER `RAM$<主账号名>:role/<RAM角色名>`;