DataWorks Copilot-大数据开发治理平台 DataWorks-阿里云-大数据开发治理平台 DataWorks(DataWorks)-阿里云帮助中心

告别繁琐的数据“体力活”，DataWorks 内置更懂你的 AI 助手—DataWorks Copilot。DataWorks Copilot 致力于将您从重复、低效的工作中解放出来，把宝贵的时间还给创新与思考；让数据开发，重归简单高效。它深度集成于DataWorks，只需通过自然语言下达指令，Copilot 就能为您：

代码编程：将想法即时转化为高质量、规范化的代码。
自动创建任务：智能完成数据开发与治理相关任务，让流程自动化。
沉淀团队智慧：将最佳实践和业务知识作为上下文融入每一次思考。

功能概述

什么是DataWorks Copilot

DataWorks Copilot，作为一站式智能数据开发治理平台 DataWorks 的智能助手，借助AI推理和自然语言处理能力，在代码开发场景下，帮助开发者根据自然语言快速完成多种代码相关操作，包括 SQL/Python 代码的生成、续写、改写、优化、解释及代码纠错/测试用例生成等功能。作为数据开发的智能引擎，能够根据上下文快速理解业务需求，在企业专属领域知识库的加持下，DataWorks Copilot让开发者能够轻松、高效、便捷地完成数据ETL及数据分析工作，节省时间和精力。

DataWorks Copilot 包含Agent智能体、代码编程助手和快捷AI操作三大核心能力，深度融合于DataWorks的各个产品模块中，为您带来全新的智能化数据工作体验。

核心价值

提升效率：通过代码自动生成、智能补全、自然语言交互等方式，大幅缩短数据开发和分析的周期。
降低门槛：让不熟悉复杂SQL或产品操作的用户，也能通过自然语言快速上手，完成数据开发治理任务。
保障质量：利用AI进行代码纠错、优化和测试用例生成，提升代码质量和可维护性。
知识沉淀：通过自定义企业知识库，将企业规范、业务口径、技术标准融入AI，实现知识的传承与应用。

开放地域与策略

开放对象：DataWorks 基础版及以上规格的客户。部分功能仅限新版数据开发Data Studio可用。
开放地域：华北3（张家口）、华北2（北京）、华北6（乌兰察布）、华东1（杭州）、华东2（上海）、华南1（深圳）、西南1（成都）、中国香港、新加坡、马来西亚（吉隆坡）、印度尼西亚（雅加达）、日本（东京）。
当前阶段：全面公测。由主账号、租户管理员或同等权限的用户，点击Copilot，仔细阅读《DataWorks Copilot服务协议》后，点击“确认参加”即可。确认，该主账号下的所有用户即可开启Copilot的使用。
费用说明：公测期间，DataWorks Copilot 完全免费。公测结束后将转为正式的付费服务。

重要
计划自2026年4月1日起，DataWorks Copilot 将正式启用商业化收费模式。具体计费方案将在正式商用前于官网提前发布。

快速入门

如何唤起Copilot

您可以通过以下方式与Copilot进行交互：

全局入口：点击DataWorks界面顶部右侧的Copilot图标，即可打开Copilot Chat对话窗口。
编辑器内：在代码类数据开发节点的智能代码编辑器中，通过右键菜单或快捷键唤起。
模块内嵌：在特定产品模块的功能区域，带有Copilot标识的快捷操作按钮。

主要交互界面概览

说明

在全局入口处，Copilot 提供预置的场景化示例（如数据同步、智能找表、数据开发、数据治理等），您可点击相应卡片，快速获取符合该场景的示例 Prompt，降低使用门槛，提升交互效率。

核心功能详解

Agent智能体：自动化完成复杂任务

功能概述

DataWorks Agent 服务，引领数据开发与治理进入全新的自动化时代。它不再局限于问答，而是化身为一个能够自主完成复杂任务的智能体。

使用DataWorks Agent，可以通过自然语言交互来自动化完成DataWorks上数据开发、数据治理的部分任务，例如数据集成、数据开发、数据地图、数据治理等。通过大模型的深度思考及规划能力，Agent可以充分理解用户的任务，对任务进行步骤分解并制定执行计划，并调用MCP Server中的相关工具来自动化执行任务。DataWorks将持续丰富和迭代DataWorks MCP Server中的工具集，致力于为用户提供更加智能和高效的数据开发治理产品体验。

核心功能亮点

深度理解与自主规划：基于上下文感知与多轮对话，准确识别复杂意图，自主将任务分解为可执行的多步骤计划。
数据开发治理过程自动化：深度融合DataWorks核心产品能力与流程，全面打通上下文数据，内置DataWorks工具集。

功能入口

在Copilot Chat对话框中，从Ask模式切换至Agent模式。
根据您的任务类型，输入/选择合适的Agent类型。
通过提问方式，向Agent下达指令。

最佳实践场景

场景1 - 数据开发Agent

功能描述：提供基于自然语言的ETL开发体验，覆盖需求分析、代码生成、工作流生成到发起发布的全流程。

示例：

场景2 - 数据集成Agent

功能描述：支持用户以自然语言方式（如中文或英文）直接描述数据同步需求，系统即可自动解析语义，智能生成对应的数据同步任务配置，包括源端与目标端的数据源类型、表结构映射、字段过滤条件、分区策略及调度参数等。

示例：

场景3 - 数据地图Agent

功能描述：专注于提升数据查找与理解的效率。通过AI驱动的自然语言交互，您可以在海量数据中快速完成元数据多种场景下的探索。

核心能力：

自然语言搜索：支持自然语言问答，无需精确关键词，基于业务意图即可快速定位目标数据。例如，“找一下和用户活跃度相关的汇总表”。
自动范围调整：支持在对话中指定范围，Agent将自动理解语义，快速基于该范围进行数据定位。例如，“在adm_bi项目下，查找和业务经营相关的表”。
深度数据理解：支持对目标数据进行追问，快速获取血缘、负责人、字段释义等详细信息。例如，“@dws_bi_metric_di这张表的直接下游有哪些？如果变动后会对哪些负责人有影响？”。

示例：

场景4 - 数据治理Agent

功能描述：DataWorks数据治理Agent，驱动企业数据治理从主动式迈向“自主式”数据治理。数据治理不再是复杂的数据分析和大量的表单配置修改，现在只需通过自然语言指令，转化为精准的治理动作，通过专家级的治理能力进行治理操作的设置，并可进行自动执行。

核心能力：

质量规则配置：通过自然语言，帮助用户对指定的重点表，自动配置质量监控规则；数据治理Agent可智能分析指定表的字段类型、业务语义和重要性，自动推荐并配置合理监控规则，如主键唯一性、非空约束、枚举值范围校验等，高效完成以往需要多次探查数据和规则配置的工作。
- 示例：帮我针对 dim_user_info 这张核心用户维表，自动生成质量规则。
- 示例：针对ods_开头的表，自动配置表行数相关质量规则。
质量问题治理：针对数据资产治理模块中，已由系统自动发现的待治理的质量问题，如“热门访问表未配置质量规则”，“高基线任务产出表未配置质量规则”等问题，可直接通过自然语言给出治理要求，系统自动分析问题并进行相应治理
- 示例：找出热门访问表未配置质量规则的表，推荐并配置质量规则。
- 示例：帮我治理质量维度的问题。

示例：

质量规则配置
质量问题治理

场景5 - 数据运维Agent

功能描述：旨在为任务实例提供全面的健康评估与问题定位。通过融合依赖链路、资源水位、历史运行趋势、变更影响、日志异常及数据质量等多维度分析，自动生成结构化的诊断报告。

关于更多数据运维Agent的说明，可以参见：AI运维。

代码编程助手：提升编码效率与质量

功能概述

DataWorks Copilot 智能编程助手基于先进的大语言模型，通过自然语言交互，能高效完成SQL/Python代码的生成、优化、解释和测试等任务。为确保最佳效果，您可以在DataWorks默认模型、千问及DeepSeek等多种的模型间自由切换，从而显著提升ETL开发与数据分析的效率。

核心功能亮点

多模型自由切换：支持默认模型、Qwen3-235B-A22B等。
ETL全链路支持：支持SQL和Python语言的代码生成/问答/改写/优化/纠错/注释/测试用例生成/解释等。
上下文感知：理解对话内容、代码、表结构、数据血缘、自定义知识库等。

功能入口

智能代码编辑器

场景一：智能代码补全

使用方法：在您进行代码类节点开发时，Copilot会根据上下文（已输入的代码、引用的表结构等）智能预测并推荐后续代码片段，补全建议会自动出现，按Tab键采纳。

场景二：右键菜单快捷操作

使用方法：在智能代码编辑器中，按需选中代码，单击鼠标右键，在弹出的菜单中选择Copilot。

Copilot Chat（Ask模式）

Ask模式是Copilot Chat的默认模式，适用于以问答形式解决具体的编码问题。支持用户完成代码生成、代码改写、代码纠错、生成注释、代码解释、代码优化、代码测试、代码问答、 Notebook Cell 智能生成与快捷找表。使用Copilot Chat Ask模式时，支持选中编辑器中的代码作为上下文，进行针对性的操作。

最佳实践场景

场景1 - 快速生成ETL脚本

功能描述：您可通过自然语言表达您的业务需求，DataWorks Copilot会将自然语言指令自动转换成SQL/Python语句。

示例："基于dwd_ec_trd_create_ord_di表，统计2024年9月1日至2024年9月18日每个spu的销售额、销量、sku数量、买家数量、卖家数量"。

场景2 - 基于已有代码片段继续生成代码

功能描述：DataWorks Copilot代码补全能力，可对您正在编写的SQL进行智能代码补全。

示例：无需指令，自动生成，根据界面提示按键接受即可。

场景3 - 对已有代码进行改写

功能描述：您可通过自然语言对已有代码进行修改，只需要用自然语言说出您的要求，DataWorks Copilot就会对指定的代码进行改写。

示例："修改sql，将其结果从列转置为行，使用unpivot实现"。

场景4 - 快速排查代码中存在的错误并修正

功能描述：在DataWorks中，在代码执行前，您可以主动对已有代码进行错误检查；在代码运行出错后，也可以通过一键纠错，发起对代码错误的纠正。DataWorks Copilot会告诉您当前代码运行出错的原因以及修正后的代码。

示例：选中代码后右键，选择快捷指令即可。

场景5 - 解释一段代码的业务含义

功能描述：DataWorks Copilot可对您指定的代码内容进行解释，提升代码的可读性，方便您快速学习和理解代码。

示例："解释一下这段SQL"。

场景6 - 为已有代码生成字段注释

功能描述：DataWorks Copilot可以对指定的代码生成注释，提升代码的完整性及可读性。

示例："为每个字段添加注释"。

场景7 - 解答对于SQL语法或者函数的用法

功能描述：您可以用自然语言提出对SQL语法或者MaxCompute函数的相关问题，DataWorks Copilot会给出解释和用法示例，帮助您加深对SQL语法及函数的理解。

示例："MaxCompute中的mapjoin怎么写"。

场景8 - 对已有代码进行性能优化

功能描述：在DataWorks Copilot Chat窗口中，您可以对指定的代码发起SQL优化，如引入JOIN结合多表等方式简化代码逻辑，提升代码运行效率，一定程度降低数据库的负载。

示例：选中代码后，在对话框中使用快捷指令。

场景9 - 对已有代码生成测试用例

功能描述：在DataWorks Copilot Chat窗口中，您可以对指定的代码生成测试用例。DataWorks Copilot会为您生成完整的代码测试报告，包含单元测试、代码性能、边界条件验证等多角度，并生成测试代码，您可据此逐步验证任务代码的每个部分是否按预期工作。

示例："生成SQL测试用例并讲解测试步骤"。

快捷AI操作：简化产品模块内操作

DataWorks数据开发/运维/质量等模块通过利用大模型的能力，提供便捷智能化产品操作，希望能为开发者和企业用户提供智能化产品体验，以高效完成 DataWorks 产品操作。

查询结果智能可视化

功能描述：在DataWorks-数据开发/数据分析中，借助DataWorks Copilot智能图表助手，您可一键生成基于查询结果的可视化图表及数据见解。
使用入口：在节点运行或SQL查询结果处，切换至可视化页签。

AI智能建表

功能描述：在Data Studio数据目录中，借助DataWorks Copilot建表助手，只需输入表名关键字即可完成表的创建。也可一键触发，智能推荐字段名称和字段描述的补全。
使用入口：

任务发布描述生成

功能描述：在Data Studio中，在发布环节，借助DataWorks Copilot发布助手，您可一键生成上线发布描述，提高发布效率。
使用入口：

任务异常智能诊断

功能描述：DataWorks运维中心的智能诊断正式对接Qwen、DeepSeek-R1（671B）模型。当任务运行异常时，您只需点击运行诊断，大模型即可秒级提取日志中的关键信息、提供错误分析、解决建议，并推荐错误修复的快捷操作，让AI成为您的运维。
使用入口：在运维中心页面，单击左侧导航栏周期任务运维 > 周期实例，进入周期实例页面。单击运行失败实例，选中运行失败节点，单击右下角的运行诊断即可对任务进行智能诊断。

数据质量规则智能推荐

功能描述：用户可以通过一键唤起Copilot的能力，基于DataWorks中完整的元数据信息，快速生成适用于特定数据表或业务场景的数据质量规则，支持多种数据源类型及多维度质量校验。
使用入口：在数据质量页面，单击左侧导航栏规则配置 > 按表配置，进入按表配置规则页面。选择目标表，单击右侧的新建质量监控，进入该表的质量规则配置。

数据服务API

功能描述：DataWorks数据服务能够借助Copilot智能助手进行快捷API封装，根据业务需求一键生成SQL脚本并自动解析为API的请求参数和返回参数。
使用入口：在数据服务模块中，新建生成API并选择脚本模式。

高级功能与最佳实践

提升回答准确性：为Copilot提供精准“记忆”

为了让Copilot的回答更贴合您的企业规范和业务场景，我们强烈建议您为其提供精准的知识。

自定义知识（Rules）

功能描述：Rules是您为Copilot定义的一系列规则、规范和背景知识，它会指导Copilot的思考和回答。
设置入口：在Copilot Chat对话框右上角，点击图标，进入Rules配置页面。
企业级Rules与个人级Rules：
- 企业级Rules：由管理员统一配置，支持设置生效范围。适用于定义公司级的业务术语、编码规范等。
- 个人级Rules：由用户个人配置，仅对自己生效。适用于定义个人偏好、常用代码片段等。

在对话中指定上下文（Context）

功能描述：在每一次对话中，您可以手动指定与当前任务相关的上下文，让Copilot聚焦于这些信息进行回答，从而获得更精准的结果。
支持的上下文类型：
- 表：引用一张或多张表的元数据信息。
- 节点/代码文件：如引用某个节点中的代码。
- 数据专辑：引用数据地图中的数据专辑。
- Rules：临时指定某个或某几个Rules对当前对话生效。
- 本地文件：上传本地的文档作为背景信息。
如何引用上下文：在Copilot Chat输入框中，输入@或者单击+，即可弹出上下文选择器进行添加。

管理您的对话

查看对话历史

Copilot会自动记录您最近的对话。

记录范围：支持查看最近7天内，最多100个对话记录。
查看入口：在Copilot Chat窗口顶部右侧的“历史会话”。

实践建议：为不同任务开启新对话

我们强烈建议您为每一个独立的任务开启一个新的对话（New Chat）。

原因：这样可以避免不同任务的上下文互相干扰，让Copilot更专注于当前任务，从而保证回答的准确性和相关性。

常见问题（FAQ）

Q：为什么Copilot的回答不准确或不符合我的预期？

A：可能是因为缺乏足够的上下文。请尝试使用在对话中指定上下文（Context）中描述的方法，为Copilot提供更精确的背景信息。
Q： Ask模式和Agent模式有什么区别？我该如何选择？

A： Ask模式适用于一问一答式的简单任务，如生成一段代码、解释一个函数。Agent模式适用于需要多个步骤、调用多种工具的复杂任务。
Q：如何让 Copilot 优先使用英文回复？

A：您可通过以下方式引导 Copilot 使用英文响应：
- 在提问时明确添加指令，例如：请用英文回答、Respond in English 或 Explain in English；
- 切换至 DataWorks 英文界面，提升模型对英文输出的一致性与准确性。