在本实验中,您将体验到DataWorks Copilot在编程助手方面的能力,包括代码生成、代码改写、代码解释、代码补全,一键纠错、语法和函数解释等。此外,您还可探索多项小而美的Agent能力,如AI建表、智能图表生成、节点及函数发布的描述生成等。
背景介绍
DataWorks简介
DataWorks是智能湖仓一体数据开发治理平台,内置阿里巴巴15年大数据建设方法论,深度适配阿里云MaxCompute、E-MapReduce、Hologres、Flink、PAI 等数十种大数据和AI计算服务,为数据仓库、数据湖、OpenLake湖仓一体数据架构提供智能化ETL开发、数据分析与主动式数据资产治理服务,助力“Data+AI”全生命周期的数据管理。自2009年起,DataWorks不断对阿里巴巴数据体系进行产品化沉淀,服务于政务、金融、零售、互联网、汽车、制造等行业,使数以万计的客户信赖并选择DataWorks进行数字化升级和价值创造。
DataWorks Copilot是您在DataWorks的智能助手,在DataWorks,您可以自由选择用DataWorks默认模型、DeepSeek-R1-671B(满血版)和DeepSeek-R1-Distill-Qwen-32B大模型来完成相关Copilot产品操作。借助DeepSeek-R1的深度推理能力,DataWorks Copilot可以帮助您通过自然语言交互完成更为复杂的SQL代码生成、优化、测试等操作,显著提升ETL开发和数据分析效率。
注意事项
当前DataWorks Copilot产品存在公测地域限制和版本限制,详情请参见公测说明。
DataWorks Copilot支持的语言类型包含SQL及Python,本实验以SQL操作为主。
DataWorks Copilot不区分引擎,支持所有代码类节点,本实验以MaxCompute节点为示例。
环境准备
开通DataWorks服务,详情请参见开通DataWorks服务。
创建DataWorks工作空间,详情请参见创建工作空间。
满足公测条件的用户,参与Copilot产品公测使用,详情请参见智能助手(DataWorks Copilot)。
实验步骤
以下实验不分先后次序,您可按需体验。
NL2Code
DataWorks Copilot支持根据自然语言返回SQL代码。
在Data Studio页面,单击项目目录右侧的
,单击级联菜单中的“MaxCompute SQL”进入MaxCompute SQL节点编辑功能界面。
在进入工作流编辑功能界面前,请先输入名称节点,键盘敲击回车键,等待即可。
预设节点名称:
ads_ec_ec360_gmv_kpi_overview
。在代码编辑器中,单击Copilot,进入Copilot功能界面。在Copilot功能界面中输入指令,单击发送按钮,等待Copilot返回结果。
预设指令:
基于dwd_ec_trd_create_ord_di表,统计2024年9月1日至2024年9月18日每个SPU的销售额、销量、SKU数量、买家数量、卖家数量
。
代码补全
DataWorks Copilot支持在编写代码过程中为您进行代码补全。
在Data Studio页面,新建一个MaxCompute节点,在代码编辑器中,单击Copilot,进入Copilot功能界面。输入任意一段包含表名的代码片段,输入空格或者回车,等待Copilot返回结果。
智能问答
DataWorks Copilot支持根据自然语言对已有代码进行纠错、注释生成及代码解释等操作。同时,它还支持为您解答SQL相关的语法及函数问题。
SQL改写
在Data Studio页面,新建一个MaxCompute节点,在代码编辑器中,输入并选中任意一段代码,单击顶部菜单栏右侧的Copilot,进入Copilot Chat功能界面,在Chat输入框中,输入您的改写要求,单击发送,等待Copilot返回结果。
预设指令:
修改sql,将其结果从列转置为行,使用unpivot实现
。-
SQL 纠错
在Data Studio页面,新建一个MaxCompute节点,在代码编辑器中,输入并选中任意一段代码,鼠标右键,单击右键功能列表中的Copilot,在二级功能列表中找到并单击SQL纠错,进入Copilot Chat功能界面,单击发送,等待Copilot返回结果。
SQL解释
在Data Studio页面,新建一个MaxCompute节点,在代码编辑器中,输入并选中任意一段代码,单击顶部菜单栏右侧的Copilot,进入Copilot Chat功能界面,在Chat输入框中,输入您的指令,单击发送,等待Copilot返回结果。
预设指令:
解释一下这段SQL
。-
生成注释
在Data Studio页面,新建一个MaxCompute节点,在代码编辑器中,输入并选中任意一段代码,鼠标右键,单击右键功能列表中的Copilot,在二级功能列表中找到并单击生成注释,进入Copilot Chat功能界面,输入您的指令,单击发送,等待Copilot返回结果。
预设指令:
为每个字段添加注释
。-
语法与函数问答
在Data Studio页面,单击顶部菜单栏右侧的Copilot,进入Copilot Chat功能界面,在Chat输入框中,输入您的指令,单击发送,等待Copilot返回结果。
预设指令一:
MaxCompute中如何使用CTE语法
。预设指令二:
MaxCompute中mapjoin怎么写
。预设指令三:
MaxCompute pivot函数如何使用
。预设指令四:
一张表有一个自动递增的id字段,不连续,如何按页获取id的范围
。预设指令五:
我有表t1(name)和表t2(name),请编写SQL实现当t1.name为空时用t2.name来填充
。
AI Agent
Data Studio、数据分析、数据地图及数据服务等模块都提供了一些便捷的Copilot操作,利用大模型来降低大家使用产品的难度。如:借助Copilot建表助手,您只需输入表名关键字即可完成表的创建;借助Copilot分析助手,您只需动动手指,即可一键获得面向数据查询结果的可视化图表及数据见解。
智能建表
在Data Studio页面,单击左侧一级菜单栏中的数据目录,在数据目录列表中,选择任意一个数据目录,新建表,进入新建表的功能界面,单击页面顶部中的Copilot 建表,进入Copilot 建表功能界面,在输入框中,输入您的指令,单击发送,等待Copilot返回结果。
预设指令:会员注册信息表
。
数据图表及见解生成
在Data Studio页面,新建一个MaxCompute节点,在代码编辑器中,输入并选中任意一段可运行的代码,单击编辑器上方的运行按钮,等待SQL查询结果,待SQL运行成功且有查询结果数据时,单击查询结果区的图表功能,进入图表功能界面后,单击页面顶部的Copilot,等待Copilot返回结果。
描述生成
在Data Studio页面,新建一个MaxCompute节点,在代码编辑器中,输入并选中任意一段可运行的代码,单击页面右侧的调度配置并完成内容填写,单击编辑器上方的发布按钮,进入节点发布功能界面后,单击描述窗口右下方的Copilot图标,等待Copilot返回结果。
预设节点名称:ads_ec_ec360_gmv_kpi_overview
。
在Data Studio页面,单击左侧一级菜单栏中的资源管理,打开任意一个已有的MaxCompute函数,或者新建一个MaxCompute函数,进入函数编辑功能页面后,单击描述窗口右下方的Copilot图标,等待Copilot返回结果。
预设函数名称:udfjaccardsimilarity
。
- 本页导读 (1)
- 背景介绍
- 注意事项
- 环境准备
- 实验步骤
- NL2Code
- 代码补全
- 智能问答
- AI Agent