告别繁琐的数据“体力活”,DataWorks 内置 AI 智能体 (Agent) — Data Agent。Data Agent 致力于将您从重复、低效的工作中解放出来,把宝贵的时间还给创新与思考,让数据工作重归简单高效。它深度融合于 DataWorks 的各个产品模块,只需通过自然语言下达指令,就能在数据集成、开发、运维、治理、分析全链路中为您:
加速代码开发: 快速生成、优化和解释代码,将您的想法即时转化为高质量、规范化的代码。
自动化任务编排: 智能创建并编排数据集成、开发与治理等任务,实现端到端流程自动化。
沉淀团队智慧:将最佳实践和业务知识作为上下文融入每一次思考。
功能概述
什么是Data Agent
Data Agent,是 DataWorks 平台内的一站式 AI 智能体,包含Agent智能体、代码编程助手、ChatBI以及快捷AI操作等核心能力。它深度融合于DataWorks的各个产品模块中,覆盖数据集成、开发、运维、治理、分析全链路,借助强大的 AI 推理和自然语言处理能力,为您提供高效可信的智能化数据开发体验。
核心价值
提升效率:通过代码自动生成、智能补全、自然语言交互等方式,大幅缩短数据开发和分析的周期。
降低门槛:让不熟悉复杂SQL或产品操作的用户,也能通过自然语言快速上手,完成数据开发治理任务。
保障质量:利用AI进行代码纠错、优化和测试用例生成,提升代码质量和可维护性。
知识沉淀:通过自定义企业知识库,将企业规范、业务口径、技术标准融入AI,实现知识的传承与应用。
开放地域与策略
开放对象:DataWorks 基础版及以上规格的客户。部分功能仅限新版数据开发Data Studio可用。
开放地域:华北3(张家口)、华北2(北京)、华北6(乌兰察布)、华东1(杭州)、华东2(上海)、华南1(深圳)、西南1(成都)、中国香港、新加坡、马来西亚(吉隆坡)、印度尼西亚(雅加达)、日本(东京)。
当前阶段:全面公测。由主账号、租户管理员或同等权限的用户,点击Data Agent,仔细阅读《DataWorks Copilot服务协议》后,点击“确认参加”即可。确认,该主账号下的所有用户即可开启Data Agent的使用。
费用说明:公测期间,Data Agent 完全免费。公测结束后将转为正式的付费服务。
重要自2026年4月15日起,Data Agent 将正式启用商业化收费模式。具体计费方案请参见Data Agent 费用。
快速入门
如何唤起Data Agent
您可以通过以下方式与Data Agent进行交互:
全局入口:单击Data Studio页面顶部导航栏右上角的
,即可打开Data Agent Chat对话窗口。编辑器内:在代码类数据开发节点的智能代码编辑器中,通过右键菜单或快捷键唤起。
模块内嵌:在特定产品模块的功能区域,带有Copilot标识的快捷操作按钮。

在全局入口处,Data Agent 提供预置的场景化示例(如数据同步、智能找表、数据开发、数据治理等),您可点击相应卡片,快速获取符合该场景的示例 Prompt,降低使用门槛,提升交互效率。
核心功能详解
Agent智能体:自动化完成复杂任务
功能概述
DataWorks Agent 服务,引领数据开发与治理进入全新的自动化时代。它不再局限于问答,而是化身为一个能够自主完成复杂任务的智能体。
使用DataWorks Agent,可以通过自然语言交互来自动化完成DataWorks上数据开发、数据治理的部分任务,例如数据集成、数据开发、数据地图、数据治理等。通过大模型的深度思考及规划能力,Agent可以充分理解用户的任务,对任务进行步骤分解并制定执行计划,并调用MCP Server中的相关工具来自动化执行任务。DataWorks将持续丰富和迭代DataWorks MCP Server中的工具集,致力于为用户提供更加智能和高效的数据开发治理产品体验。
核心功能亮点
深度理解与自主规划:基于上下文感知与多轮对话,准确识别复杂意图,自主将任务分解为可执行的多步骤计划。
数据开发治理过程自动化:深度融合DataWorks核心产品能力与流程,全面打通上下文数据,内置DataWorks工具集。
功能入口
在Data Agent Chat对话框中,从Ask模式切换至Agent模式。
根据您的任务类型,输入
/选择合适的Agent类型。通过提问方式,向Agent下达指令。
最佳实践场景
场景1 - 数据集成Agent
功能描述:支持用户以自然语言方式(如中文或英文)直接描述数据同步需求,系统即可自动解析语义,智能生成对应的数据同步任务配置,包括源端与目标端的数据源类型、表结构映射、字段过滤条件、分区策略及调度参数等。
示例:
场景2 - 数据开发Agent
功能描述:提供基于自然语言的ETL开发体验,覆盖需求分析、代码生成、工作流生成到发起发布的全流程。
示例:
场景3 - 数据运维Agent
功能描述:旨在为任务实例提供全面的健康评估与问题定位。通过融合依赖链路、资源水位、历史运行趋势、变更影响、日志异常及数据质量等多维度分析,自动生成结构化的诊断报告。
关于更多数据运维Agent的说明,可以参见:AI运维。
示例:
场景4 - 数据地图Agent
功能描述:专注于提升数据查找与理解的效率。通过AI驱动的自然语言交互,您可以在海量数据中快速完成元数据多种场景下的探索。
核心能力:
自然语言搜索:支持自然语言问答,无需精确关键词,基于业务意图即可快速定位目标数据。例如,“找一下和用户活跃度相关的汇总表”。
自动范围调整:支持在对话中指定范围,Agent将自动理解语义,快速基于该范围进行数据定位。例如,“在adm_bi项目下,查找和业务经营相关的表”。
深度数据理解:支持对目标数据进行追问,快速获取血缘、负责人、字段释义等详细信息。例如,“@dws_bi_metric_di这张表的直接下游有哪些?如果变动后会对哪些负责人有影响?”。
示例:
场景5 - 数据治理Agent
功能描述:DataWorks数据治理Agent,驱动企业数据治理从主动式迈向“自主式”数据治理。数据治理不再是复杂的数据分析和大量的表单配置修改,现在只需通过自然语言指令,转化为精准的治理动作,通过专家级的治理能力进行治理操作的设置,并可进行自动执行。
核心能力:
质量规则配置:通过自然语言,帮助用户对指定的重点表,自动配置质量监控规则;数据治理Agent可智能分析指定表的字段类型、业务语义和重要性,自动推荐并配置合理监控规则,如主键唯一性、非空约束、枚举值范围校验等,高效完成以往需要多次探查数据和规则配置的工作。
示例:帮我针对
dim_user_info这张核心用户维表,自动生成质量规则。示例:针对
ods_开头的表,自动配置表行数相关质量规则。
质量问题治理:针对数据资产治理模块中,已由系统自动发现的待治理的质量问题,如“热门访问表未配置质量规则”,“高基线任务产出表未配置质量规则”等问题,可直接通过自然语言给出治理要求,系统自动分析问题并进行相应治理
示例:找出热门访问表未配置质量规则的表,推荐并配置质量规则。
示例:帮我治理质量维度的问题。
示例:
代码编程助手:提升编码效率与质量
功能概述
Data Agent 智能编程助手基于先进的大语言模型,通过自然语言交互,能高效完成SQL/Python代码的生成、优化、解释和测试等任务。为确保最佳效果,您可以在DataWorks默认模型、千问及DeepSeek等多种的模型间自由切换,从而显著提升ETL开发与数据分析的效率。
核心功能亮点
多模型自由切换:支持默认模型、Qwen3-235B-A22B等。
ETL全链路支持:支持SQL和Python语言的代码生成/问答/改写/优化/纠错/注释/测试用例生成/解释等。
上下文感知:理解对话内容、代码、表结构、数据血缘、自定义知识库等。
功能入口
智能代码编辑器
场景一:智能代码补全
使用方法:在您进行代码类节点开发时,Data Agent会根据上下文(已输入的代码、引用的表结构等)智能预测并推荐后续代码片段,补全建议会自动出现,按Tab键采纳。
场景二:右键菜单快捷操作
使用方法:在智能代码编辑器中,按需选中代码,单击鼠标右键,在弹出的菜单中选择Copilot。

Data Agent Chat(Ask模式)
Ask模式是Data Agent Chat的默认模式,适用于以问答形式解决具体的编码问题。支持用户完成代码生成、代码改写、代码纠错、生成注释、代码解释、代码优化、代码测试、代码问答、 Notebook Cell 智能生成与快捷找表。使用Data Agent Chat Ask模式时,支持选中编辑器中的代码作为上下文,进行针对性的操作。
快捷AI操作:简化产品模块内操作
DataWorks数据开发/运维/质量等模块通过利用大模型的能力,提供便捷智能化产品操作,希望能为开发者和企业用户提供智能化产品体验,以高效完成 DataWorks 产品操作。
查询结果智能可视化
功能描述:在DataWorks-数据开发/数据分析中,借助Data Agent智能图表助手,您可一键生成基于查询结果的可视化图表及数据见解。
使用入口:在节点运行或SQL查询结果处,切换至可视化页签。

AI智能建表
功能描述:在Data Studio数据目录中,借助Data Agent建表助手,只需输入表名关键字即可完成表的创建。也可一键触发,智能推荐字段名称和字段描述的补全。
使用入口:在Data Studio中新建表时,单击页面左上角的Copilot建表按钮,输入建表需求描述,Copilot将自动生成包含字段定义和DDL的建表方案。
任务发布描述生成
功能描述:在Data Studio中,在发布环节,借助发布助手,您可一键生成上线发布描述,提高发布效率。
使用入口:在Data Studio中,在发布环节,单击发布描述输入框右侧的Copilot生成描述按钮即可自动生成发布描述。
任务异常智能诊断
功能描述:DataWorks运维中心的智能诊断正式对接Qwen、DeepSeek-R1(671B)模型。当任务运行异常时,您只需点击运行诊断,大模型即可秒级提取日志中的关键信息、提供错误分析、解决建议,并推荐错误修复的快捷操作,让AI成为您的运维。
使用入口:在运维中心页面,单击左侧导航栏,进入周期实例页面。单击运行失败实例,选中运行失败节点,单击右下角的运行诊断即可对任务进行智能诊断。
数据质量规则智能推荐
功能描述:用户可以通过一键唤起Data Agent的能力,基于DataWorks中完整的元数据信息,快速生成适用于特定数据表或业务场景的数据质量规则,支持多种数据源类型及多维度质量校验。
使用入口:在数据质量页面,单击左侧导航栏,进入按表配置规则页面。选择目标表,单击右侧的新建质量监控,进入该表的质量规则配置。

数据服务API
功能描述:DataWorks数据服务能够借助Data Agent智能助手进行快捷API封装,根据业务需求一键生成SQL脚本并自动解析为API的请求参数和返回参数。
使用入口:在数据服务模块中,新建生成API并选择脚本模式。

ChatBI:将自然语言转化为数据洞察
ChatBI是一款基于大语言模型的对话式智能分析工具。您只需用自然语言描述分析需求,ChatBI即可自动完成目标表识别、SQL生成与执行、可视化图表绘制和分析结论提炼,帮助您在无需编写代码的情况下快速获得专业的数据分析报告。详情可参见:ChatBI 概述。
高级功能与最佳实践
提升回答准确性:为Data Agent提供精准“记忆”
为了让Data Agent的回答更贴合您的企业规范和业务场景,我们强烈建议您为其提供精准的知识。
自定义知识(Rules)
功能描述:Rules是您为Data Agent定义的一系列规则、规范和背景知识,它会指导Data Agent的思考和回答。
设置入口:在Data Agent Chat对话框右上角,点击
图标,进入Rules配置页面。企业级Rules与个人级Rules:
企业级Rules:由管理员统一配置,支持设置生效范围。适用于定义公司级的业务术语、编码规范等。
个人级Rules:由用户个人配置,仅对自己生效。适用于定义个人偏好、常用代码片段等。
在对话中指定上下文(Context)
功能描述:在每一次对话中,您可以手动指定与当前任务相关的上下文,让Data Agent聚焦于这些信息进行回答,从而获得更精准的结果。
支持的上下文类型:
表:引用一张或多张表的元数据信息。
节点/代码文件:如引用某个节点中的代码。
数据专辑:引用数据地图中的数据专辑。
Rules:临时指定某个或某几个Rules对当前对话生效。
本地文件:上传本地的文档作为背景信息。
如何引用上下文:在Data Agent Chat输入框中,输入
@或者单击+,即可弹出上下文选择器进行添加。
管理您的对话
查看对话历史
Data Agent会自动记录您最近的对话。
记录范围:支持查看最近7天内,最多100个对话记录。
查看入口:在Data Agent Chat窗口顶部右侧的“历史会话”。
实践建议:为不同任务开启新对话
我们强烈建议您为每一个独立的任务开启一个新的对话(New Chat)。
原因:这样可以避免不同任务的上下文互相干扰,让Data Agent更专注于当前任务,从而保证回答的准确性和相关性。
常见问题(FAQ)
Q: 为什么Data Agent的回答不准确或不符合我的预期?
A: 可能是因为缺乏足够的上下文。请尝试使用在对话中指定上下文(Context)中描述的方法,为Data Agent提供更精确的背景信息。
Q: Ask模式和Agent模式有什么区别?我该如何选择?
A: Ask模式适用于一问一答式的简单任务,如生成一段代码、解释一个函数。Agent模式适用于需要多个步骤、调用多种工具的复杂任务。
Q: 如何让 Data Agent 优先使用英文回复?
A: 您可通过以下方式引导 Data Agent 使用英文响应:
在提问时明确添加指令,例如:
请用英文回答、Respond in English或Explain in English;切换至 DataWorks 英文界面,提升模型对英文输出的一致性与准确性。

