通过即席查询您可以根据当前的业务情况自定义并执行查询语句和下载查询的数据。例如,当完成计算任务开发后,您可以通过即席查询验证计算任务是否符合预期。本文为您介绍如何新建即席查询并下载结果数据。
背景信息
即席查询任务使用您当前项目下所设置的计算源进行数据查询。在使用Hadoop计算源时,支持开启Impala任务,开启后除支持创建HIVE_SQL即席查询任务外,还支持创建IMPALA_SQL即席查询任务。因Impala基于内存计算,IMPALA_SQL即席查询相对于HIVE_SQL即席查询具备更好的查询响应。同时Dataphin支持IMPALA_SQL和HIVE_SQL任务类型的快速切换,对于历史任务无需再次编写相同的查询代码。具体操作,请参见附录:切换任务类型。
前提条件
创建IMPALA_SQL即席查询需在Hadoop计算源中开启Impala任务。具体操作,请参见创建Hadoop计算源。
若您需下载即席查询的结果数据,在您开始执行操作前,请确认您已开启项目下载数据的权限。具体操作,请参见管理项目空间的权限和计算源。
新建即席查询
在Dataphin首页的顶部菜单栏中,选择研发 > 数据研发。
在顶部菜单栏选择项目(Dev-Prod模式还需选择环境)。
在左侧导航栏选择即席查询,在即席查询列表中单击
图标。支持创建计算引擎即席查询和数据库SQL即席查询。
在新建即席查询对话框中,配置以下参数。
若您的计算引擎为Hadoop并开启了Impala任务,支持新建HIVE_SQL即席查询和IMPALA_SQL即席查询。
参数
描述
参数
描述
名称
填写即席查询名称。
长度不超过256个字符,不支持竖线(|)、正斜线(/)、反斜线(\)、半角冒号(:)、半角问号(?)、尖括号(<>)、星号(*)和半角引号(")。
描述
填写对即席查询的简单描述。
选择目录
选择任务所存放的目录,默认为临时代码。
若未创建目录,您可以新建文件夹,操作方法如下:
在页面左侧计算任务列表上方单击
图标,打开新建文件夹对话框。
在新建文件夹对话框中输入文件夹名称并根据需要选择目录位置。
单击确定。
数据源类型
支持MySQL、Oracle、AnalyticDB for PostgreSQL、AnalyticDB for MySQL 2.0、AnalyticDB for MySQL 3.0、PostgreSQL、ClickHouse、Presto、StarRocks、Doris、SelectDB、GaussDB(DWS)数据源类型。
仅创建数据库SQL即席查询时,支持配置此参数。
数据源
选择用于即席查询的数据源。若无可选数据源,可以单击+新建数据源进行新建。
仅创建数据库SQL即席查询时,支持配置此参数。
单击确定,完成即席查询文件的创建。
根据项目的计算源或数据库SQL类型,编写查询数据的代码。代码编写完成后,单击编辑器顶部的运行。
查询语句执行成功后,在控制台中查看运行结果数据。
下载结果数据
查询语句执行成功后,单击控制台右上角的图标,下载执行结果数据。
支持完整数据下载或样例数据下载。
完整数据下载:完整数据下载固定为CSV格式。完整数据下载耗时可能较长,可关注消息中心消息或在运行记录查看下载进度。
数据库SQL即席查询不支持查询结果的全量下载,仅支持样例数据下载。
样例数据下载:样例数据下载的格式和数据运行记录由数据下载审批设置决定。更多信息,请参见数据下载配置。
附录:切换任务类型
项目的离线引擎为Hadoop计算源且已开启Impala任务。支持IMPALA_SQL任务类型和HIVE_SQL任务类型的互相切换。
在即席查看列表中,选择目标IMPALA_SQL类型或HIVE_SQL类型的任务,单击任务名称后的
图标,选择修改类型。
在修改类型对话框中,选择修改后的类型。下图以IMPALA_SQL任务类型切换为HIVE_SQL任务类型为例。
单击确定,即可完成任务类型切换。
- 本页导读 (0)
- 背景信息
- 前提条件
- 新建即席查询
- 下载结果数据
- 附录:切换任务类型