如果需要快速地对数据进行查询与分析,您可以使用SQL语句查询MaxCompute、EMR Hive、Hologres等数据源。本文为您介绍如何通过SQL语句查询数据源。
本文档适用于新版数据分析,旧版操作请参见SQL查询(旧版)。您可通过导航栏切换新旧版数据分析。
支持的数据源
SQL查询支持的数据源类型包含:MaxCompute、Hologres、EMR、CDH、ADB for PostgreSQL、ADB for MySQL、ClickHouse、StarRocks、MySQL、PostgreSQL、Oracle、SQL Server、Doris、SelectDB。
仅MaxCompute支持直接连接和数据源两种方式查询,其他类型数据源仅支持已添加到工作空间的数据源。
数据源权限说明
数据源范围
数据源连接模式:仅支持选择有权限的工作空间内的数据源数据,因此您需要先联系管理员将您添加为工作空间的数据分析师、开发、运维、空间管理员。
直接连接模式:仅支持选择当前登录账号已经加入的MaxCompute项目。MaxCompute项目相关权限设置,请参见MaxCompute用户与权限。
数据源访问权限
数据源访问支持以下两种身份模式访问。
访问身份模式 | 模式说明 | 支持数据源 | 授权操作 |
执行者身份 | 当前登录DataWorks的阿里云账号身份。 | MaxCompute和Hologres。 | 让指定MaxCompute项目或者Hologres实例的管理者,授权您成员访问权限。 |
数据源默认访问身份 | 创建数据源时配置的访问身份。 | 本功能支持的数据源。 | 若您当前登录账号非数据源默认访问身份时,需让拥有工作空间管理员权限的用户为您当前登录的云账号授权。 |
如果MaxCompute项目空间开启了白名单访问控制,请在MaxCompute项目IP白名单上添加附录:数据分析白名单列表。
功能入口
登录DataWorks数据分析,切换至目标地域后,单击进入数据分析页面。
若在导航栏看到前往新版数据分析,单击切换进入新版数据分析页面。
若在导航栏看到返回旧版数据分析,则表示已进入新版数据分析页面。
新建SQL查询
鼠标悬浮至,单击右侧的。
您也可以单击新建文件夹,自定义规划SQL查询文件的目录结构。
在SQL编辑页面,编写SQL查询语句。
重要也可通过以下方式生成SQL语句:
在数据目录页面,添加数据目录之后,找到目标表右键选择生成查询SQL。
复制他人文件目录下分享给你的SQL。
编辑SQL后,您可以单击顶部的格式化按钮,对代码进行格式化。
SQL查询支持使用Copilot,您可以单击导航栏右上角Copilot图标(
),使用智能助手的相关功能(如代码生成、代码纠错等),辅助完成代码编写;同时,Copilot还支持在编辑器中代码自动补全,提升编写效率。
编写完成SQL查询代码后,单击右侧运行配置,设置SQL查询时使用的数据源、脚本参数等。

在SQL编辑页面顶部工具栏单击运行,然后在结果窗口中,查看执行SQL内容、运行日志、运行结果。

查询结果可视化
在查询结果左侧工具栏,单击
按钮,可将结果自动生成可视化图表。
您可单击图表上方的Copilot按钮,体验DataWorks Copilot智能图表与见解生成能力。
您可以单击编辑图表按钮,对图表样式进行调整。

导出与分享
若您有将数据导出到本地后再导入到其他数据源的需求,建议通过数据集成的离线同步任务进行同步,从而实现更高效、稳定的数据迁移与同步。
在SQL查询结果右侧,单击导出,支持导出如下形式:
本地文件:将查询结果以CSV格式下载至本地。关键说明如下:
说明项
具体描述
下载限制
下载范围
您可选择下载仅表格中展示数据或全部数据。
仅表格中展示数据:仅下载当前页面展示的数据,默认最多为
10000条。全部数据:导出限制范围内所查询的全部结果数据。
下载方式
支持审批下载和免审批下载。
审批下载:支持您通过设置风险识别规则来识别下载数据操作行为中的风险。下载数据时,需提交下载审批申请,以确保数据使用的合规性和安全性。
说明仅DataWorks企业版支持设置并开启风险识别规则。
免审批下载:默认为免审批下载,在下载过程中无需进行权限申请。
对象存储OSS:将查询结果以指定格式(如CSV、Parquet)导出至阿里云对象存储OSS(Object Storage Service)空间,适用于大数据量归档或与其他云产品集成的场景。
首次使用时,您需要为DataWorks进行授权,以允许其访问您的OSS资源。请在文件路径下拉框中,单击提示信息中的一键授权链接,根据页面指引完成RAM授权。
配置项
说明
文件路径
点击右侧文件夹按钮,选择您希望存储结果文件的OSS Bucket及目录。
文件名
系统将自动生成一个文件名,您也可以手动修改。
文本类型
选择导出的文件格式。支持
csv、text、orc、parquet。分隔符
指定列与列之间的分隔符号。默认为英文逗号(
,)。编码格式
选择文件的编码格式,例如
UTF-8、GBK等。CU
为本次导出任务配置计算资源单元(CU)的数量。默认值为1 CU。
资源组
选择用于执行本次导出任务的Serverless资源组。当不选时,将会默认使用数据分析>系统管理中设置的数据集成资源组。
配置完成后,单击确定即可启动导出任务。您可以在任务运行页面查看导出进度、运行日志和配置详情。任务成功后,可进入OSS控制台,将已经导出的目标文件下载到本地。
钉钉表格:支持导出至钉钉表格,具体操作请参见导出查询结果至钉钉。