DataWorks 智能助手

DataWorks Copilot是集成在DataWorks中的新一代AI智能助手,您可以通过自然语言与之对话或在操作界面中获得即时帮助,从而极大地提升数据开发与分析的效率。

Copilot 简介

DataWorks Copilot 是深度集成在阿里云 DataWorks 平台中的新一代AI智能助手。它旨在通过先进的自然语言处理技术和强大的代码模型,改变您与数据交互和进行数据开发的方式。无论您是需要快速解答一个SQL难题,还是希望自动化完成整个ETL链路的构建,Copilot都能成为您最得力的“副驾驶”,助您轻松、高效地完成数据工作,释放数据潜能。

DataWorks Copilot 的核心能力通过两种交互模式提供,以适应您在不同场景下的需求:

  • Copilot Chat (对话式AI):一个全能的对话窗口,是您进行复杂问题探讨、任务规划和自动化流程执行的“指挥中心”。

  • Copilot AI in place (沉浸式AI):无缝嵌入在您日常操作界面中的“贴身助理”,在您最需要的时候,就地提供上下文相关的智能辅助。

Copilot Chat 对话式AI助理

Copilot Chat 是一个强大的对话式交互界面,您可以通过自然语言与之沟通,完成从简单问答到复杂工作流编排的各种任务。它主要包含两种核心能力:AskAgent

Ask:智能代码助手

Copilot Ask 模式专注于快速响应您的代码和技术问题,是您的“随身数据专家”。当您有明确的、与代码相关的需求时,Ask可以提供即时帮助。

核心能力包括:

能力类型

能力说明

示例(您可以这样对Copilot说)

代码生成

根据用户指令生成代码。

“帮我写一个SQL,查询sales表中每个城市销售额最高的前三名产品。”

代码改写

对指定代码按要求进行改写。

“把这段用JOIN实现的SQL改写成使用窗口函数。”

代码纠错

对指定代码进行错误查找和修正。

“这段SQL执行报错,提示invalid identifier,帮我看看哪里错了。”

生成注释

对指定代码生成注释。

“为这段复杂的SQL逻辑添加中文注释,解释每个CTE的作用。”

代码解释

对指定代码进行解释。

“解释一下这段代码里的PARTITION BYROW_NUMBER()是什么意思。”

代码优化

对指定代码进行优化。

“这段查询很慢,帮我优化一下,看看有没有性能瓶颈。”

代码测试

对指定代码给出测试方案。

“为这段计算用户留存率的SQL设计一些测试用例,需要考虑哪些边界情况?”

代码问答

解答代码的语法、函数等问题。

“MaxComputeexplode函数和lateral view有什么区别?”

Notebook Cell 智能生成

Notebook中智能生成一个代码单元。

“创建一个cell,用pandas读取/data/users.csv文件,并显示前5行。”

快捷找表

输入关键字查找目标表。

“查找所有和‘用户’或‘user’相关的表。”

Agent:自动化任务执行

Copilot Agent 模式不仅仅可以回答问题,更是理解、规划并执行多步骤复杂任务的“智能执行官”。当您有一个宏观的目标(如“构建一个数据同步任务”)时,Agent会自动拆解任务、调用DataWorks的工具并完成端到端的操作。它基于MCP协议(模型上下文协议),支持用户自由开启/关闭需要使用的DataWorks MCP Server及其他二方、三方MCP Server,通过自然语言交互,来完成数据开发、任务运维和数据集成等产品操作,显著提升数据开发工作效率。

Copilot Agent核心流程如下:

image
  1. 用户输入需求描述:您只需用自然语言描述您的最终目标。例如:“帮我创建一个每日调度的任务,把MySQLuser_log表全量同步到MaxComputeods_user_log_dd表中。”

  2. Agent思考推理:接收到您的需求后,Agent会启动其“大脑”,深入分析您的意图,理解任务的本质和涉及的组件。

  3. Agent制定执行计划:基于思考推理的结果,Agent会将宏观目标拆解成一系列具体、有序、可执行的子任务步骤。这个计划会清晰地展示给您,例如:

    • 步骤1:创建数据源mysql_source

    • 步骤2:创建数据集成节点di_mysql_to_odps

    • 步骤3:配置调度属性为每日凌晨2点执行。

  4. Agent自动执行:在计划确认后,Agent会开始行动,自动调用DataWorks内部的各种工具(Tools/API),一步步地执行计划,例如实际创建节点、配置代码和调度参数等。

  5. (可选)用户干预:Agent并非一个完全的“黑盒”。在思考推理和自动执行的任何阶段,您都可以随时进行干预。您可以审查它的计划、修正它的某个步骤、或者在执行过程中提供额外的指令。这种人机协作的模式,确保了最终结果的准确可控。

  6. 返回执行结果:任务执行完毕后,Agent会向您汇报最终结果,并呈现已为您创建和配置好的DataWorks资产(如节点链接、任务状态等),完成整个工作流的闭环。

Copilot AI in Place 沉浸式AI助理

AI in place 模式将智能能力“融入”到您的日常工作流中,无需切换上下文,即可在编辑器、IDE等界面中获得即时帮助。

能力类型

能力描述

涉及模块

代码补全

根据当前获取到的上下文信息,对正在编写的SQL、Python进行智能代码补全。

数据开发、数据分析

智能搜索

通过自然语言交互,智能搜索内容,包含但不限于周期任务、周期实例等。

运维中心

智能建表

通过自然语言描述或关键字输入,快速创建数据表,并自动推荐、补全字段名和描述。

数据开发 (数据目录)

UDF函数描述生成

根据UDF函数的配置及代码,自动生成函数描述。

数据开发

节点发布描述生成

在发布任务节点时,一键自动生成规范、清晰的变更描述,简化发布流程。

数据开发

智能图表与见解生成

SQL查询结果进行一键分析,自动生成直观的可视化图表和摘要。

数据开发、数据分析

任务异常智能诊断

当任务运行失败时,自动诊断日志,秒级定位错误原因,提供解决方案并推荐快捷修复操作。

运维中心

质量规则智能推荐

根据表的元数据信息和业务场景,一键智能推荐并生成合适的数据质量监控规则。

数据质量

开始使用

重要

DataWorks Copilot 当前处于免费公测阶段。另外,DataWorks Copilot Agent功能处于邀测阶段,您可提交工单联系技术支持人员开通白名单。

  • 打开Copilot Chat:在DataWorks界面的顶部导航栏右上角找到 Copilot 图标,点击即可打开对话式AI窗口。在对话框左下角,您可切换选择Ask模式或者Agent模式。

    image

  • 体验AI in place:在您编写代码或使用新版IDE时,智能功能会自动触发或通过快捷菜单提供。留意编辑器中的灰色提示文本(代码补全)和界面中的“Copilot”选项。详细操作说明请参见DataWorks Copilot AI in Place