DataWorks Copilot Agent智能体基于自然语言交互,结合大模型的深度认知与规划能力,能够完成复杂的数据集成、开发及治理任务,实现从需求到成果的端到端自动化,大幅提升工作效率。本文将针对Copilot Agent智能体的功能场景以及核心特性等进行详细介绍。
功能概述
DataWorks Copilot Agent智能体基于自研Agent客户端实现,与依赖第三方客户端的基于三方客户端的DataWorks Agent实现方式不同,您无需安装额外软件或进行繁琐配置,在 DataWorks相应模块页面即可直接使用。
通过说需求,得成果的自然语言交互方式,DataWorks Copilot Agent实现了需求即代码的开发体验。您只需用自然语言描述需求,即可完成数据开发等工作,从而显著提升工作效率。DataWorks Copilot Agent 运行流程如下:
功能入口
登录 DataWorks控制台,点击左侧菜单,选择对应工作空间后点击进入数据开发(Data Studio)。
单击Data Studio页面顶部导航栏右上角的
,进入Copilot Chat,默认启用Ask模式,在对话框左下角,切换至Agent模式。
快速开始
步骤1:进入Copilot chat,切换至Agent模式
在Data Studio页面,单击顶部导航栏右上角的
,进入Copilot Chat,在对话框左下角,切换至Agent模式。
步骤2:选择Agent
您可以单击/或在输入框中输入/快速唤起 Agent 菜单,选择适用于当前任务场景的专用Agent。Agent类型包括:数据集成Agent,数据地图Agent,数据开发Agent,数据治理Agent。

步骤3:添加上下文(可选)
为了让Copilot更准确地理解您的需求,可选择添加上下文背景信息。您可以通过对话框中输入@或在对话框右下角单击@唤起该功能,从而选择您所需要添加的上下文类型。

所支持的类型有:
表:引用一张或多张表的元数据信息。
节点/代码文件:如引用某个节点中的代码。
数据专辑:引用数据地图中的数据专辑。
Rules:临时指定某个或某几个Rules对当前对话生效。
本地文件:上传本地的文档作为背景信息。
步骤4:切换大模型(可选)
Copilot默认使用默认模型,您可以单击对话框底部的
图标,在弹出的菜单中选择其他所支持的大模型。

步骤5:提交问题并可多轮对话
在对话框中输入您的需求,您可以通过连续追问或补充说明的方式进行多轮对话,逐步修正和细化您的意图,直至 Agent 完全理解并产出您期望的结果。
核心场景
借助大模型深度理解与任务编排能力,Copilot Agent 覆盖数据集成、开发、治理、地图四大关键场景。具体能力对比如下表所示。
Agent场景 | 功能描述 |
数据集成 | 支持用户以自然语言方式(如中文或英文)直接描述数据同步需求,系统即可自动解析语义,智能生成对应的数据同步任务配置,包括源端与目标端的数据源类型、表结构映射、字段过滤条件、分区策略及调度参数等。 |
数据开发 | 提供基于自然语言的ETL开发体验,覆盖需求分析、代码生成、工作流生成到发起发布的全流程。 |
数据治理 | DataWorks数据治理Agent,驱动企业数据治理从主动式迈向“自主式”数据治理。数据治理不再是复杂的数据分析和大量的表单配置修改,现在只需通过自然语言指令,转化为精准的治理动作,通过专家级的治理能力进行治理操作的设置,并可进行自动执行。 |
数据地图 | 专注于提升数据查找与理解的效率。通过AI驱动的自然语言交互,您可以在海量数据中快速完成元数据多种场景下的探索。 |
场景1 - 数据集成Agent
功能描述:支持用户以自然语言方式(如中文或英文)直接描述数据同步需求,系统即可自动解析语义,智能生成对应的数据同步任务配置,包括源端与目标端的数据源类型、表结构映射、字段过滤条件、分区策略及调度参数等。
操作步骤:
在对话框中输入
/并选择数据集成Agent。描述您的数据同步需求,包括源端、目标端、表名以及同步方式等。例如:“帮我创建一个离线同步任务,把MySQL的
ods_user_info_d表同步到MaxCompute的ods_user_info_d表”Agent 会解析您的需求,并自动填充数据源、表映射等信息来创建数据同步节点。
创建完成后,您可以点击查看与修改。
操作示例:
场景2 - 数据开发Agent
功能描述:提供基于自然语言的ETL开发体验,覆盖需求分析、代码生成、工作流生成到发起发布的全流程。
操作步骤:
在对话框中输入
/并选择数据开发Agent。使用自然语言描述您的数据开发需求,并可按需添加上下文。例如:“构建用户画像分析工作流”。
Agent 会将任务分解为多个步骤(如创建节点、生成代码、配置依赖)执行。
针对生成的节点代码,您可以查看并选择是否保留或撤销。
操作示例:
场景3 - 数据治理Agent
功能描述:DataWorks数据治理Agent,驱动企业数据治理从主动式迈向“自主式”数据治理。数据治理不再是复杂的数据分析和大量的表单配置修改,现在只需通过自然语言指令,转化为精准的治理动作,通过专家级的治理能力进行治理操作的设置,并可进行自动执行。
核心能力:
质量规则配置:通过自然语言,帮助用户对指定的重点表,自动配置质量监控规则;数据治理Agent可智能分析指定表的字段类型、业务语义和重要性,自动推荐并配置合理监控规则,如主键唯一性、非空约束、枚举值范围校验等,高效完成以往需要多次探查数据和规则配置的工作。
示例:帮我针对
dim_user_info这张核心用户维表,自动生成质量规则。示例:针对
ods_开头的表,自动配置表行数相关质量规则。
质量问题治理:针对数据资产治理模块中,已由系统自动发现的待治理的质量问题,如“热门访问表未配置质量规则”,“高基线任务产出表未配置质量规则”等问题,可直接通过自然语言给出治理要求,系统自动分析问题并进行相应治理
示例:找出热门访问表未配置质量规则的表,推荐并配置质量规则。
示例:帮我治理质量维度的问题。
操作示例:
质量规则配置

质量问题治理

场景4 - 数据地图Agent
功能描述:专注于提升数据查找与理解的效率。通过AI驱动的自然语言交互,您可以在海量数据中快速完成元数据多种场景下的探索。
核心能力:
自然语言搜索:支持自然语言问答,无需精确关键词,基于业务意图即可快速定位目标数据。例如,“找一下和用户活跃度相关的汇总表”。
自动范围调整:支持在对话中指定范围,Agent将自动理解语义,快速基于该范围进行数据定位。例如,“在adm_bi项目下,查找和业务经营相关的表”。
深度数据理解:支持对目标数据进行追问,快速获取血缘、负责人、字段释义等详细信息。例如,“@dws_bi_metric_di这张表的直接下游有哪些?如果变动后会对哪些负责人有影响?”。
操作示例:
相关文档
了解定制化Agent功能,详情请参见基于三方客户端的DataWorks Agent。

