告别繁琐的数据“体力活”,DataWorks 内置更懂你的 AI 助手—DataWorks Copilot。DataWorks Copilot 致力于将您从重复、低效的工作中解放出来,把宝贵的时间还给创新与思考;让数据开发,重归简单高效。它深度集成于DataWorks,只需通过自然语言下达指令,Copilot 就能为您:
代码编程:将想法即时转化为高质量、规范化的代码。
自动创建任务:智能完成数据开发与治理相关任务,让流程自动化。
沉淀团队智慧:将最佳实践和业务知识作为上下文融入每一次思考。
一、功能概述
什么是DataWorks Copilot
DataWorks Copilot,作为一站式智能数据开发治理平台 DataWorks 的智能助手,借助AI推理和自然语言处理能力,在代码开发场景下,帮助开发者根据自然语言快速完成多种代码相关操作,包括 SQL/Python 代码的生成、续写、改写、优化、解释及代码纠错/测试用例生成等功能。作为数据开发的智能引擎,能够根据上下文快速理解业务需求,在企业专属领域知识库的加持下,DataWorks Copilot让开发者能够轻松、高效、便捷地完成数据ETL及数据分析工作,节省时间和精力。
DataWorks Copilot 包含代码编程助手、Agent智能体和快捷AI操作三大核心能力,深度融合于DataWorks的各个产品模块中,为您带来全新的智能化数据工作体验。
核心价值
提升效率:通过代码自动生成、智能补全、自然语言交互等方式,大幅缩短数据开发和分析的周期。
降低门槛:让不熟悉复杂SQL或产品操作的用户,也能通过自然语言快速上手,完成数据开发治理任务。
保障质量:利用AI进行代码纠错、优化和测试用例生成,提升代码质量和可维护性。
知识沉淀:通过自定义企业知识库,将企业规范、业务口径、技术标准融入AI,实现知识的传承与应用。
开放地域与策略
开放对象:DataWorks 基础版及以上规格的客户。部分功能仅限新版数据开发Data Studio可用。
开放地域:华北3(张家口)、华北2(北京)、华北6(乌兰察布)、华东1(杭州)、华东2(上海)、华南1(深圳)、西南1(成都)、中国香港、新加坡、马来西亚(吉隆坡)、印度尼西亚(雅加达)、日本(东京)。
当前阶段:全面公测。由主账号、租户管理员或同等权限的用户,点击Copilot,仔细阅读《DataWorks Copilot服务协议》后,点击“确认参加”即可。确认,该主账号下的所有用户即可开启Copilot的使用。
费用说明:公测期间,DataWorks Copilot 完全免费。公测结束后将转为正式的付费服务,具体收费模式将另行公布。
二、快速入门
如何唤起Copilot
您可以通过以下方式与Copilot进行交互:
全局入口:点击DataWorks界面顶部右侧的Copilot图标,即可打开Copilot Chat对话窗口。
编辑器内:在代码类数据开发节点的智能代码编辑器中,通过右键菜单或快捷键唤起。
模块内嵌:在特定产品模块的功能区域,带有Copilot标识的快捷操作按钮。
主要交互界面概览

三、核心功能详解
代码编程助手:提升编码效率与质量
功能概述
DataWorks Copilot 智能编程助手基于先进的大语言模型,通过自然语言交互,能高效完成SQL/Python代码的生成、优化、解释和测试等任务。为确保最佳效果,您可以在DataWorks默认模型、通义千问及DeepSeek等多种的模型间自由切换,从而显著提升ETL开发与数据分析的效率。
核心功能亮点
多模型自由切换:支持默认模型、Qwen3-235B-A22B等。
ETL全链路支持:支持SQL和Python语言的代码生成/问答/改写/优化/纠错/注释/测试用例生成/解释等。
上下文感知:理解对话内容、代码、表结构、数据血缘、自定义知识库等。
功能入口
智能代码编辑器
场景一:智能代码补全
使用方法:在您进行代码类节点开发时,Copilot会根据上下文(已输入的代码、引用的表结构等)智能预测并推荐后续代码片段,补全建议会自动出现,按Tab键采纳。
场景二:右键菜单快捷操作
使用方法:在智能代码编辑器中,按需选中代码,单击鼠标右键,在弹出的菜单中选择Copilot。

Copilot Chat(Ask模式)
Ask模式是Copilot Chat的默认模式,适用于以问答形式解决具体的编码问题。支持用户完成代码生成、代码改写、代码纠错、生成注释、代码解释、代码优化、代码测试、代码问答、 Notebook Cell 智能生快捷找表。使用Copilot Chat Ask模式时,支持选中编辑器中的代码作为上下文,进行针对性的操作。

最佳实践场景
场景1 - 快速生成ETL脚本
功能描述:您可通过自然语言表达您的业务需求,DataWorks Copilot会将自然语言指令自动转换成SQL/Python语句。
示例:"基于dwd_ec_trd_create_ord_di表,统计2024年9月1日至2024年9月18日每个spu的销售额、销量、sku数量、买家数量、卖家数量"。
场景2 - 基于已有代码片段继续生成代码
功能描述:DataWorks Copilot代码补全能力,可对您正在编写的SQL进行智能代码补全。
示例:无需指令,自动生成,根据界面提示按键接受即可。

场景3 - 对已有代码进行改写
功能描述:您可通过自然语言对已有代码进行修改,只需要用自然语言说出您的要求,DataWorks Copilot就会对指定的代码进行改写。
示例:"修改sql,将其结果从列转置为行,使用unpivot实现"。
场景4 - 快速排查代码中存在的错误并修正
功能描述:在DataWorks中,在代码执行前,您可以主动对已有代码进行错误检查;在代码运行出错后,也可以通过一键纠错,发起对代码错误的纠正。DataWorks Copilot会告诉您当前代码运行出错的原因以及修正后的代码。
示例:选中代码后右键,选择快捷指令即可。
场景5 - 解释一段代码的业务含义
功能描述:DataWorks Copilot可对您指定的代码内容进行解释,提升代码的可读性,方便您快速学习和理解代码。
示例:"解释一下这段SQL"。
场景6 - 为已有代码生成字段注释
功能描述:DataWorks Copilot可以对指定的代码生成注释,提升代码的完整性及可读性。
示例:"为每个字段添加注释"。
场景7 - 解答对于SQL语法或者函数的用法
功能描述:您可以用自然语言提出对SQL语法或者MaxCompute函数的相关问题,DataWorks Copilot会给出解释和用法示例,帮助您加深对SQL语法及函数的理解。
示例:"MaxCompute中的mapjoin怎么写"。
场景8 - 对已有代码进行性能优化
功能描述:在DataWorks Copilot Chat窗口中,您可以对指定的代码发起SQL优化,如引入JOIN结合多表等方式简化代码逻辑,提升代码运行效率,一定程度降低数据库的负载。
示例:选中代码后,在对话框中使用快捷指令。
场景9 - 对已有代码生成测试用例
功能描述:在DataWorks Copilot Chat窗口中,您可以对指定的代码生成测试用例。DataWorks Copilot会为您生成完整的代码测试报告,包含单元测试、代码性能、边界条件验证等多角度,并生成测试代码,您可据此逐步验证任务代码的每个部分是否按预期工作。
示例:"生成SQL测试用例并讲解测试步骤"。
Agent智能体:自动化完成复杂任务
功能概述
DataWorks Agent 服务,引领数据开发与治理进入全新的自动化时代。它不再局限于问答,而是化身为一个能够自主完成复杂任务的智能体。
使用DataWorks Agent,可以通过自然语言交互来自动化完成DataWorks上数据开发、数据治理的部分任务,例如数据集成、数据开发、数据地图、数据治理等。通过大模型的深度思考及规划能力,Agent可以充分理解用户的任务,对任务进行步骤分解并制定执行计划,并调用MCP Server中的相关工具来自动化执行任务。DataWorks将持续丰富和迭代DataWorks MCP Server中的工具集,致力于为用户提供更加智能和高效的数据开发治理产品体验。
核心功能亮点
深度理解与自主规划:基于上下文感知与多轮对话,准确识别复杂意图,自主将任务分解为可执行的多步骤计划。
数据开发治理过程自动化:深度融合DataWorks核心产品能力与流程,全面打通上下文数据,内置DataWarks工具集。
功能入口
在Copilot Chat对话框中,从Ask模式切换至Agent模式。
根据您的任务类型,输入
/选择合适的Agent类型。通过提问方式,向Agent下达指令。

最佳实践场景
场景1 - 数据开发Agent
功能描述:提供基于自然语言的ETL开发体验,覆盖需求分析、代码生成、工作流生成到发起发布的全流程。
示例:
场景2 - 数据地图Agent
功能描述:专注于提升数据查找与理解的效率。通过AI驱动的自然语言交互,您可以在海量数据中快速完成元数据多种场景下的探索。
核心能力:
自然语言搜索:支持自然语言问答,无需精确关键词,基于业务意图即可快速定位目标数据。例如,“找一下和用户活跃度相关的汇总表”。
自动范围调整:支持在对话中指定范围,Agent将自动理解语义,快速基于该范围进行数据定位。例如,“在adm_bi项目下,查找和业务经营相关的表”。
深度数据理解:支持对目标数据进行追问,快速获取血缘、负责人、字段释义等详细信息。例如,“@dws_bi_metric_di这张表的直接下游有哪些?如果变动后会对哪些负责人有影响?”。
示例:
场景3 - 数据治理Agent
功能描述:DataWorks数据治理Agent,驱动企业数据治理从主动式迈向“自主式”数据治理。数据治理不再是复杂的数据分析和大量的表单配置修改,现在只需通过自然语言指令,转化为精准的治理动作,通过专家级的治理能力进行治理操作的设置,并可进行自动执行。
核心能力:
质量规则配置:通过自然语言,帮助用户对指定的重点表,自动配置质量监控规则;数据治理Agent可智能分析指定表的字段类型、业务语义和重要性,自动推荐并配置合理监控规则,如主键唯一性、非空约束、枚举值范围校验等,高效完成以往需要多次探查数据和规则配置的工作。
示例:帮我针对
dim_user_info这张核心用户维表,自动生成质量规则。示例:针对
ods_开头的表,自动配置表行数相关质量规则。
质量问题治理:针对数据资产治理模块中,已由系统自动发现的待治理的质量问题,如“热门访问表未配置质量规则”,“高基线任务产出表未配置质量规则”等问题,可直接通过自然语言给出治理要求,系统自动分析问题并进行相应治理
示例:找出热门访问表未配置质量规则的表,推荐并配置质量规则。
示例:帮我治理质量维度的问题。
示例:
质量规则配置

质量问题治理

快捷AI操作:简化产品模块内操作
DataWorks数据开发/运维/质量等模块通过利用大模型的能力,提供便捷智能化产品操作,希望能为开发者和企业用户提供智能化产品体验,以高效完成 DataWorks 产品操作。
查询结果智能可视化
功能描述:在DataWorks-数据开发/数据分析中,借助DataWorks Copilot智能图表助手,您可一键生成基于查询结果的可视化图表及数据见解。
使用入口:在节点运行或SQL查询结果处,切换至可视化页签。

AI智能建表
功能描述:在Data Studio数据目录中,借助DataWorks Copilot建表助手,只需输入表名关键字即可完成表的创建。也可一键触发,智能推荐字段名称和字段描述的补全。
使用入口:

任务发布描述生成
功能描述:在Data Studio中,在发布环节,借助DataWorks Copilot发布助手,您可一键生成上线发布描述,提高发布效率。
使用入口:

任务异常智能诊断
功能描述:DataWorks运维中心的智能诊断正式对接Qwen、DeepSeek-R1(671B)模型。当任务运行异常时,您只需点击运行诊断,大模型即可秒级提取日志中的关键信息、提供错误分析、解决建议,并推荐错误修复的快捷操作,让AI成为您的运维。
使用入口:在运维中心页面,单击左侧导航栏,进入周期实例页面。单击运行失败实例,选中运行失败节点,单击右下角的运行诊断即可对任务进行智能诊断。

数据质量规则智能推荐
功能描述:用户可以通过一键唤起Copilot的能力,基于DataWorks中完整的元数据信息,快速生成适用于特定数据表或业务场景的数据质量规则,支持多种数据源类型及多维度质量校验。
使用入口:在数据质量页面,单击左侧导航栏,进入按表配置规则页面。选择目标表,单击右侧的新建质量监控,进入该表的质量规则配置。

数据服务API
功能描述:DataWorks数据服务能够借助Copilot智能助手进行快捷API封装,根据业务需求一键生成SQL脚本并自动解析为API的请求参数和返回参数。
使用入口:在数据服务模块中,新建生成API并选择脚本模式。

四、高级功能与最佳实践
提升回答准确性:为Copilot提供精准“记忆”
为了让Copilot的回答更贴合您的企业规范和业务场景,我们强烈建议您为其提供精准的知识。
自定义知识(Rules)
功能描述:Rules是您为Copilot定义的一系列规则、规范和背景知识,它会指导Copilot的思考和回答。
设置入口:在Copilot Chat对话框右上角,点击
图标,进入Rules配置页面。企业级Rules与个人级Rules:
企业级Rules:由管理员统一配置,支持设置生效范围。适用于定义公司级的业务术语、编码规范等。
个人级Rules:由用户个人配置,仅对自己生效。适用于定义个人偏好、常用代码片段等。

在对话中指定上下文(Context)
功能描述:在每一次对话中,您可以手动指定与当前任务相关的上下文,让Copilot聚焦于这些信息进行回答,从而获得更精准的结果。
支持的上下文类型:
表:引用一张或多张表的元数据信息。
节点/代码文件:如引用某个节点中的代码。
数据专辑:引用数据地图中的数据专辑。
Rules:临时指定某个或某几个Rules对当前对话生效。
本地文件:上传本地的文档作为背景信息。
如何引用上下文:在Copilot Chat输入框中,输出
@或者单击+,即可弹出上下文选择器进行添加。
管理您的对话
查看对话历史
Copilot会自动记录您最近的对话。
记录范围:支持查看最近7天内,最多100个对话记录。
查看入口:在Copilot Chat窗口顶部右侧的“历史会话”。

实践建议:为不同任务开启新对话
我们强烈建议您为每一个独立的任务开启一个新的对话(New Chat)。
原因:这样可以避免不同任务的上下文互相干扰,让Copilot更专注于当前任务,从而保证回答的准确性和相关性。
五、常见问题(FAQ)
Q: 为什么Copilot的回答不准确或不符合我的预期?
A: 可能是因为缺乏足够的上下文。请尝试使用在对话中指定上下文(Context)中描述的方法,为Copilot提供更精确的背景信息。
Q: Ask模式和Agent模式有什么区别?我该如何选择?
A: Ask模式适用于一问一答式的简单任务,如生成一段代码、解释一个函数。
Agent模式适用于需要多个步骤、调用多种工具的复杂任务。