DataWorks Copilot是集成在DataWorks中的新一代AI智能助手,您可以通过自然语言与之对话或在操作界面中获得即时帮助,从而极大地提升数据开发与分析的效率。
Copilot 简介
DataWorks Copilot 是深度集成在阿里云 DataWorks 平台中的新一代AI智能助手。它旨在通过先进的自然语言处理技术和强大的代码模型,改变您与数据交互和进行数据开发的方式。无论您是需要快速解答一个SQL难题,还是希望自动化完成整个ETL链路的构建,Copilot都能成为您最得力的“副驾驶”,助您轻松、高效地完成数据工作,释放数据潜能。
DataWorks Copilot 的核心能力通过两种交互模式提供,以适应您在不同场景下的需求:
Copilot Chat (对话式AI):一个全能的对话窗口,是您进行复杂问题探讨、任务规划和自动化流程执行的“指挥中心”。
Copilot AI in place (沉浸式AI):无缝嵌入在您日常操作界面中的“贴身助理”,在您最需要的时候,就地提供上下文相关的智能辅助。
Copilot Chat 对话式AI助理
Copilot Chat 是一个强大的对话式交互界面,您可以通过自然语言与之沟通,完成从简单问答到复杂工作流编排的各种任务。它主要包含两种核心能力:Ask 和 Agent。
Ask:智能代码助手
Copilot Ask 模式专注于快速响应您的代码和技术问题,是您的“随身数据专家”。当您有明确的、与代码相关的需求时,Ask可以提供即时帮助。
核心能力包括:
能力类型 | 能力说明 | 示例(您可以这样对Copilot说) |
| 根据用户指令生成代码。 | “帮我写一个SQL,查询 |
| 对指定代码按要求进行改写。 | “把这段用 |
| 对指定代码进行错误查找和修正。 | “这段SQL执行报错,提示 |
| 对指定代码生成注释。 | “为这段复杂的SQL逻辑添加中文注释,解释每个CTE的作用。” |
| 对指定代码进行解释。 | “解释一下这段代码里的 |
| 对指定代码进行优化。 | “这段查询很慢,帮我优化一下,看看有没有性能瓶颈。” |
| 对指定代码给出测试方案。 | “为这段计算用户留存率的SQL设计一些测试用例,需要考虑哪些边界情况?” |
| 解答代码的语法、函数等问题。 | “MaxCompute的 |
| 在Notebook中智能生成一个代码单元。 | “创建一个cell,用pandas读取 |
| 输入关键字查找目标表。 | “查找所有和‘用户’或‘user’相关的表。” |
Agent:自动化任务执行
Copilot Agent 模式不仅仅可以回答问题,更是理解、规划并执行多步骤复杂任务的“智能执行官”。当您有一个宏观的目标(如“构建一个数据同步任务”)时,Agent会自动拆解任务、调用DataWorks的工具并完成端到端的操作。它基于MCP协议(模型上下文协议),支持用户自由开启/关闭需要使用的DataWorks MCP Server及其他二方、三方MCP Server,通过自然语言交互,来完成数据开发、任务运维和数据集成等产品操作,显著提升数据开发工作效率。
Copilot Agent核心流程如下:
用户输入需求描述:您只需用自然语言描述您的最终目标。例如:“帮我创建一个每日调度的任务,把MySQL的
user_log
表全量同步到MaxCompute的ods_user_log_dd
表中。”Agent思考推理:接收到您的需求后,Agent会启动其“大脑”,深入分析您的意图,理解任务的本质和涉及的组件。
Agent制定执行计划:基于思考推理的结果,Agent会将宏观目标拆解成一系列具体、有序、可执行的子任务步骤。这个计划会清晰地展示给您,例如:
步骤1:创建数据源
mysql_source
。步骤2:创建数据集成节点
di_mysql_to_odps
。步骤3:配置调度属性为每日凌晨2点执行。
Agent自动执行:在计划确认后,Agent会开始行动,自动调用DataWorks内部的各种工具(Tools/API),一步步地执行计划,例如实际创建节点、配置代码和调度参数等。
(可选)用户干预:Agent并非一个完全的“黑盒”。在思考推理和自动执行的任何阶段,您都可以随时进行干预。您可以审查它的计划、修正它的某个步骤、或者在执行过程中提供额外的指令。这种人机协作的模式,确保了最终结果的准确可控。
返回执行结果:任务执行完毕后,Agent会向您汇报最终结果,并呈现已为您创建和配置好的DataWorks资产(如节点链接、任务状态等),完成整个工作流的闭环。
Copilot AI in Place 沉浸式AI助理
AI in place 模式将智能能力“融入”到您的日常工作流中,无需切换上下文,即可在编辑器、IDE等界面中获得即时帮助。
能力类型 | 能力描述 | 涉及模块 |
| 根据当前获取到的上下文信息,对正在编写的SQL、Python进行智能代码补全。 | 数据开发、数据分析 |
| 通过自然语言交互,智能搜索内容,包含但不限于周期任务、周期实例等。 | 运维中心 |
| 通过自然语言描述或关键字输入,快速创建数据表,并自动推荐、补全字段名和描述。 | 数据开发 (数据目录) |
| 根据UDF函数的配置及代码,自动生成函数描述。 | 数据开发 |
| 在发布任务节点时,一键自动生成规范、清晰的变更描述,简化发布流程。 | 数据开发 |
| 对SQL查询结果进行一键分析,自动生成直观的可视化图表和摘要。 | 数据开发、数据分析 |
| 当任务运行失败时,自动诊断日志,秒级定位错误原因,提供解决方案并推荐快捷修复操作。 | 运维中心 |
| 根据表的元数据信息和业务场景,一键智能推荐并生成合适的数据质量监控规则。 | 数据质量 |
开始使用
DataWorks Copilot 当前处于免费公测阶段。另外,DataWorks Copilot Agent功能处于邀测阶段,您可提交工单联系技术支持人员开通白名单。
打开Copilot Chat:在DataWorks界面的顶部导航栏右上角找到 Copilot 图标,点击即可打开对话式AI窗口。在对话框左下角,您可切换选择Ask模式或者Agent模式。
Ask 模式功能使用指南:DataWorks Copilot Ask。
Agent 模式功能使用指南:DataWorks Copilot Agent。
未开通白名单用户,可使用DataWorks Agent。
体验AI in place:在您编写代码或使用新版IDE时,智能功能会自动触发或通过快捷菜单提供。留意编辑器中的灰色提示文本(代码补全)和界面中的“Copilot”选项。详细操作说明请参见DataWorks Copilot AI in Place。