DataWorks Copilot

告别繁琐的数据“体力活”,DataWorks 内置更懂你的 AI 助手—DataWorks Copilot。DataWorks Copilot 致力于将您从重复、低效的工作中解放出来,把宝贵的时间还给创新与思考;让数据开发,重归简单高效。它深度集成于DataWorks,只需通过自然语言下达指令,Copilot 就能为您:

  • 代码编程:将想法即时转化为高质量、规范化的代码。

  • 自动创建任务:智能完成数据开发与治理相关任务,让流程自动化。

  • 沉淀团队智慧:将最佳实践和业务知识作为上下文融入每一次思考。

一、功能概述

什么是DataWorks Copilot

DataWorks Copilot,作为一站式智能数据开发治理平台 DataWorks 的智能助手,借助AI推理和自然语言处理能力,在代码开发场景下,帮助开发者根据自然语言快速完成多种代码相关操作,包括 SQL/Python 代码的生成、续写、改写、优化、解释及代码纠错/测试用例生成等功能。作为数据开发的智能引擎,能够根据上下文快速理解业务需求,在企业专属领域知识库的加持下,DataWorks Copilot让开发者能够轻松、高效、便捷地完成数据ETL及数据分析工作,节省时间和精力。

DataWorks Copilot 包含代码编程助手Agent智能体快捷AI操作三大核心能力,深度融合于DataWorks的各个产品模块中,为您带来全新的智能化数据工作体验。

核心价值

  • 提升效率:通过代码自动生成、智能补全、自然语言交互等方式,大幅缩短数据开发和分析的周期。

  • 降低门槛:让不熟悉复杂SQL或产品操作的用户,也能通过自然语言快速上手,完成数据开发治理任务。

  • 保障质量:利用AI进行代码纠错、优化和测试用例生成,提升代码质量和可维护性。

  • 知识沉淀:通过自定义企业知识库,将企业规范、业务口径、技术标准融入AI,实现知识的传承与应用。

开放地域与策略

  • 开放对象:DataWorks 基础版及以上规格的客户。部分功能仅限新版数据开发Data Studio可用。

  • 开放地域:华北3(张家口)、华北2(北京)、华北6(乌兰察布)、华东1(杭州)、华东2(上海)、华南1(深圳)、西南1(成都)、中国香港、新加坡、马来西亚(吉隆坡)、印度尼西亚(雅加达)、日本(东京)。

  • 当前阶段:全面公测。由主账号、租户管理员或同等权限的用户,点击Copilot,仔细阅读《DataWorks Copilot服务协议》后,点击“确认参加”即可。确认,该主账号下的所有用户即可开启Copilot的使用。

  • 费用说明:公测期间,DataWorks Copilot 完全免费。公测结束后将转为正式的付费服务,具体收费模式将另行公布。

二、快速入门

如何唤起Copilot

您可以通过以下方式与Copilot进行交互:

  • 全局入口:点击DataWorks界面顶部右侧的Copilot图标,即可打开Copilot Chat对话窗口。

  • 编辑器内:在代码类数据开发节点的智能代码编辑器中,通过右键菜单或快捷键唤起。

  • 模块内嵌:在特定产品模块的功能区域,带有Copilot标识的快捷操作按钮。

主要交互界面概览

image

三、核心功能详解

代码编程助手:提升编码效率与质量

功能概述

DataWorks Copilot 智能编程助手基于先进的大语言模型,通过自然语言交互,能高效完成SQL/Python代码的生成、优化、解释和测试等任务。为确保最佳效果,您可以在DataWorks默认模型、通义千问及DeepSeek等多种的模型间自由切换,从而显著提升ETL开发与数据分析的效率。

image

核心功能亮点

  • 多模型自由切换:支持默认模型、Qwen3-235B-A22B等。

  • ETL全链路支持:支持SQLPython语言的代码生成/问答/改写/优化/纠错/注释/测试用例生成/解释等。

  • 上下文感知:理解对话内容、代码、表结构、数据血缘、自定义知识库等。

功能入口

智能代码编辑器

场景一:智能代码补全

使用方法:在您进行代码类节点开发时,Copilot会根据上下文(已输入的代码、引用的表结构等)智能预测并推荐后续代码片段,补全建议会自动出现,按Tab键采纳。

场景二:右键菜单快捷操作

使用方法:在智能代码编辑器中,按需选中代码,单击鼠标右键,在弹出的菜单中选择Copilot

image

Copilot Chat(Ask模式)

Ask模式是Copilot Chat的默认模式,适用于以问答形式解决具体的编码问题。支持用户完成代码生成、代码改写、代码纠错、生成注释、代码解释、代码优化、代码测试、代码问答、 Notebook Cell 智能生快捷找表。使用Copilot Chat Ask模式时,支持选中编辑器中的代码作为上下文,进行针对性的操作。

image

最佳实践场景

场景1 - 快速生成ETL脚本

功能描述:您可通过自然语言表达您的业务需求,DataWorks Copilot会将自然语言指令自动转换成SQL/Python语句。

示例:"基于dwd_ec_trd_create_ord_di表,统计202491日至2024918日每个spu的销售额、销量、sku数量、买家数量、卖家数量"。

场景2 - 基于已有代码片段继续生成代码

功能描述:DataWorks Copilot代码补全能力,可对您正在编写的SQL进行智能代码补全。

示例:无需指令,自动生成,根据界面提示按键接受即可。

image

场景3 - 对已有代码进行改写

功能描述:您可通过自然语言对已有代码进行修改,只需要用自然语言说出您的要求,DataWorks Copilot就会对指定的代码进行改写。

示例:"修改sql,将其结果从列转置为行,使用unpivot实现"。

场景4 - 快速排查代码中存在的错误并修正

功能描述:在DataWorks中,在代码执行前,您可以主动对已有代码进行错误检查;在代码运行出错后,也可以通过一键纠错,发起对代码错误的纠正。DataWorks Copilot会告诉您当前代码运行出错的原因以及修正后的代码。

示例:选中代码后右键,选择快捷指令即可。

场景5 - 解释一段代码的业务含义

功能描述:DataWorks Copilot可对您指定的代码内容进行解释,提升代码的可读性,方便您快速学习和理解代码。

示例:"解释一下这段SQL"。

场景6 - 为已有代码生成字段注释

功能描述:DataWorks Copilot可以对指定的代码生成注释,提升代码的完整性及可读性。

示例:"为每个字段添加注释"。

场景7 - 解答对于SQL语法或者函数的用法

功能描述:您可以用自然语言提出对SQL语法或者MaxCompute函数的相关问题,DataWorks Copilot会给出解释和用法示例,帮助您加深对SQL语法及函数的理解。

示例:"MaxCompute中的mapjoin怎么写"。

场景8 - 对已有代码进行性能优化

功能描述:在DataWorks Copilot Chat窗口中,您可以对指定的代码发起SQL优化,如引入JOIN结合多表等方式简化代码逻辑,提升代码运行效率,一定程度降低数据库的负载。

示例:选中代码后,在对话框中使用快捷指令。

场景9 - 对已有代码生成测试用例

功能描述:在DataWorks Copilot Chat窗口中,您可以对指定的代码生成测试用例。DataWorks Copilot会为您生成完整的代码测试报告,包含单元测试、代码性能、边界条件验证等多角度,并生成测试代码,您可据此逐步验证任务代码的每个部分是否按预期工作。

示例:"生成SQL测试用例并讲解测试步骤"。

Agent智能体:自动化完成复杂任务

功能概述

DataWorks Agent 服务,引领数据开发与治理进入全新的自动化时代。它不再局限于问答,而是化身为一个能够自主完成复杂任务的智能体。

使用DataWorks Agent,可以通过自然语言交互来自动化完成DataWorks上数据开发、数据治理的部分任务,例如数据集成、数据开发、数据地图、数据治理等。通过大模型的深度思考及规划能力,Agent可以充分理解用户的任务,对任务进行步骤分解并制定执行计划,并调用MCP Server中的相关工具来自动化执行任务。DataWorks将持续丰富和迭代DataWorks MCP Server中的工具集,致力于为用户提供更加智能和高效的数据开发治理产品体验。

核心功能亮点

  • 深度理解与自主规划:基于上下文感知与多轮对话,准确识别复杂意图,自主将任务分解为可执行的多步骤计划。

  • 数据开发治理过程自动化:深度融合DataWorks核心产品能力与流程,全面打通上下文数据,内置DataWarks工具集。

功能入口

  1. Copilot Chat对话框中,从Ask模式切换至Agent模式

  2. 根据您的任务类型,输入/选择合适的Agent类型。

  3. 通过提问方式,向Agent下达指令。

    image

最佳实践场景

场景1 - 数据开发Agent

功能描述:提供基于自然语言的ETL开发体验,覆盖需求分析、代码生成、工作流生成到发起发布的全流程。

示例

场景2 - 数据地图Agent

功能描述:专注于提升数据查找与理解的效率。通过AI驱动的自然语言交互,您可以在海量数据中快速完成元数据多种场景下的探索。

核心能力

  • 自然语言搜索:支持自然语言问答,无需精确关键词,基于业务意图即可快速定位目标数据。例如,“找一下和用户活跃度相关的汇总表”。

  • 自动范围调整:支持在对话中指定范围,Agent将自动理解语义,快速基于该范围进行数据定位。例如,“在adm_bi项目下,查找和业务经营相关的表”。

  • 深度数据理解:支持对目标数据进行追问,快速获取血缘、负责人、字段释义等详细信息。例如,“@dws_bi_metric_di这张表的直接下游有哪些?如果变动后会对哪些负责人有影响?”。

示例

场景3 - 数据治理Agent

功能描述:DataWorks数据治理Agent,驱动企业数据治理从主动式迈向“自主式”数据治理。数据治理不再是复杂的数据分析和大量的表单配置修改,现在只需通过自然语言指令,转化为精准的治理动作,通过专家级的治理能力进行治理操作的设置,并可进行自动执行。

核心能力

  • 质量规则配置:通过自然语言,帮助用户对指定的重点表,自动配置质量监控规则;数据治理Agent可智能分析指定表的字段类型、业务语义和重要性,自动推荐并配置合理监控规则,如主键唯一性、非空约束、枚举值范围校验等,高效完成以往需要多次探查数据和规则配置的工作。

    • 示例:帮我针对 dim_user_info 这张核心用户维表,自动生成质量规则。

    • 示例:针对ods_开头的表,自动配置表行数相关质量规则。

  • 质量问题治理:针对数据资产治理模块中,已由系统自动发现的待治理的质量问题,如“热门访问表未配置质量规则”,“高基线任务产出表未配置质量规则”等问题,可直接通过自然语言给出治理要求,系统自动分析问题并进行相应治理

    • 示例:找出热门访问表未配置质量规则的表,推荐并配置质量规则。

    • 示例:帮我治理质量维度的问题。

示例

  • 质量规则配置

    image.png

  • 质量问题治理

    image.png

快捷AI操作:简化产品模块内操作

DataWorks数据开发/运维/质量等模块通过利用大模型的能力,提供便捷智能化产品操作,希望能为开发者和企业用户提供智能化产品体验,以高效完成 DataWorks 产品操作。

查询结果智能可视化

  • 功能描述:在DataWorks-数据开发/数据分析中,借助DataWorks Copilot智能图表助手,您可一键生成基于查询结果的可视化图表及数据见解。

  • 使用入口:在节点运行或SQL查询结果处,切换至可视化页签。

    image

AI智能建表

  • 功能描述:在Data Studio数据目录中,借助DataWorks Copilot建表助手,只需输入表名关键字即可完成表的创建。也可一键触发,智能推荐字段名称和字段描述的补全。

  • 使用入口

    image

任务发布描述生成

  • 功能描述:在Data Studio中,在发布环节,借助DataWorks Copilot发布助手,您可一键生成上线发布描述,提高发布效率。

  • 使用入口

    image

任务异常智能诊断

  • 功能描述:DataWorks运维中心的智能诊断正式对接Qwen、DeepSeek-R1(671B)模型。当任务运行异常时,您只需点击运行诊断,大模型即可秒级提取日志中的关键信息、提供错误分析、解决建议,并推荐错误修复的快捷操作,让AI成为您的运维。

  • 使用入口:在运维中心页面,单击左侧导航栏周期任务运维 > 周期实例,进入周期实例页面。单击运行失败实例,选中运行失败节点,单击右下角的运行诊断即可对任务进行智能诊断。

    image

数据质量规则智能推荐

  • 功能描述:用户可以通过一键唤起Copilot的能力,基于DataWorks中完整的元数据信息,快速生成适用于特定数据表或业务场景的数据质量规则,支持多种数据源类型及多维度质量校验。

  • 使用入口:在数据质量页面,单击左侧导航栏规则配置 > 按表配置,进入按表配置规则页面。选择目标表,单击右侧的新建质量监控,进入该表的质量规则配置。

    image

数据服务API

  • 功能描述:DataWorks数据服务能够借助Copilot智能助手进行快捷API封装,根据业务需求一键生成SQL脚本并自动解析为API的请求参数和返回参数。

  • 使用入口:在数据服务模块中,新建生成API并选择脚本模式。

    image

四、高级功能与最佳实践

提升回答准确性:为Copilot提供精准“记忆”

为了让Copilot的回答更贴合您的企业规范和业务场景,我们强烈建议您为其提供精准的知识。

自定义知识(Rules)

  • 功能描述:Rules是您为Copilot定义的一系列规则、规范和背景知识,它会指导Copilot的思考和回答。

  • 设置入口:在Copilot Chat对话框右上角,点击image图标,进入Rules配置页面。

  • 企业级Rules与个人级Rules

    • 企业级Rules:由管理员统一配置,支持设置生效范围。适用于定义公司级的业务术语、编码规范等。

    • 个人级Rules:由用户个人配置,仅对自己生效。适用于定义个人偏好、常用代码片段等。

    image

在对话中指定上下文(Context)

  • 功能描述:在每一次对话中,您可以手动指定与当前任务相关的上下文,让Copilot聚焦于这些信息进行回答,从而获得更精准的结果。

  • 支持的上下文类型

    • :引用一张或多张表的元数据信息。

    • 节点/代码文件:如引用某个节点中的代码。

    • 数据专辑:引用数据地图中的数据专辑。

    • Rules:临时指定某个或某几个Rules对当前对话生效。

    • 本地文件:上传本地的文档作为背景信息。

  • 如何引用上下文:在Copilot Chat输入框中,输出@或者单击+,即可弹出上下文选择器进行添加。

    image

管理您的对话

查看对话历史

Copilot会自动记录您最近的对话。

  • 记录范围:支持查看最近7内,最多100对话记录。

  • 查看入口:在Copilot Chat窗口顶部右侧的“历史会话”。

    image

实践建议:为不同任务开启新对话

我们强烈建议您为每一个独立的任务开启一个新的对话(New Chat)

  • 原因:这样可以避免不同任务的上下文互相干扰,让Copilot更专注于当前任务,从而保证回答的准确性和相关性。

五、常见问题(FAQ)

  • Q: 为什么Copilot的回答不准确或不符合我的预期?

    A: 可能是因为缺乏足够的上下文。请尝试使用在对话中指定上下文(Context)中描述的方法,为Copilot提供更精确的背景信息。

  • Q: Ask模式和Agent模式有什么区别?我该如何选择?

    A: Ask模式适用于一问一答式的简单任务,如生成一段代码、解释一个函数。

    Agent模式适用于需要多个步骤、调用多种工具的复杂任务。