DataWorks Agent

DataWorks Copilot Agent智能体基于自然语言交互,结合大模型的深度认知与规划能力,能够完成复杂的数据集成、开发及治理任务,实现从需求到成果的端到端自动化,大幅提升工作效率。本文将针对Copilot Agent智能体的功能场景以及核心特性等进行详细介绍。

功能概述

DataWorks Copilot Agent智能体基于自研Agent客户端实现,与依赖第三方客户端的基于三方客户端的DataWorks Agent实现方式不同,您无需安装额外软件或进行繁琐配置,在 DataWorks相应模块页面即可直接使用。

通过说需求,得成果的自然语言交互方式,DataWorks Copilot Agent实现了需求即代码的开发体验。您只需用自然语言描述需求,即可完成数据开发等工作,从而显著提升工作效率。DataWorks Copilot Agent 运行流程如下:

image

功能入口

  1. 登录 DataWorks控制台,点击左侧菜单数据开发与运维 > 数据开发,选择对应工作空间后点击进入数据开发(Data Studio)。

  2. 单击Data Studio页面顶部导航栏右上角的image进入Copilot Chat,默认启用Ask模式,在对话框左下角,切换至Agent模式。

    image

快速开始

步骤1:进入Copilot chat,切换至Agent模式

Data Studio页面,单击顶部导航栏右上角的image,进入Copilot Chat,在对话框左下角,切换至Agent模式。

步骤2:选择Agent

您可以单击/或在输入框中输入/快速唤起 Agent 菜单,选择适用于当前任务场景的专用Agent。Agent类型包括:数据集成Agent数据地图Agent数据开发Agent数据治理Agent

image

步骤3:添加上下文(可选)

为了让Copilot更准确地理解您的需求,可选择添加上下文背景信息。您可以通过对话框中输入@或在对话框右下角单击@唤起该功能,从而选择您所需要添加的上下文类型。

image

所支持的类型有:

  • :引用一张或多张表的元数据信息。

  • 节点/代码文件:如引用某个节点中的代码。

  • 数据专辑:引用数据地图中的数据专辑。

  • Rules:临时指定某个或某几个Rules对当前对话生效。

  • 本地文件:上传本地的文档作为背景信息。

步骤4:切换大模型(可选)

Copilot默认使用默认模型,您可以单击对话框底部的image图标,在弹出的菜单中选择其他所支持的大模型。

image

步骤5:提交问题并可多轮对话

在对话框中输入您的需求,您可以通过连续追问或补充说明的方式进行多轮对话,逐步修正和细化您的意图,直至 Agent 完全理解并产出您期望的结果。

核心场景

借助大模型深度理解与任务编排能力,Copilot Agent 覆盖数据集成、开发、治理、地图四大关键场景。具体能力对比如下表所示。

Agent场景

功能描述

数据集成

支持用户以自然语言方式(如中文或英文)直接描述数据同步需求,系统即可自动解析语义,智能生成对应的数据同步任务配置,包括源端与目标端的数据源类型、表结构映射、字段过滤条件、分区策略及调度参数等。

数据开发

提供基于自然语言的ETL开发体验,覆盖需求分析、代码生成、工作流生成到发起发布的全流程。

数据治理

DataWorks数据治理Agent,驱动企业数据治理从主动式迈向“自主式”数据治理。数据治理不再是复杂的数据分析和大量的表单配置修改,现在只需通过自然语言指令,转化为精准的治理动作,通过专家级的治理能力进行治理操作的设置,并可进行自动执行。

数据地图

专注于提升数据查找与理解的效率。通过AI驱动的自然语言交互,您可以在海量数据中快速完成元数据多种场景下的探索。

场景1 - 数据集成Agent

功能描述:支持用户以自然语言方式(如中文或英文)直接描述数据同步需求,系统即可自动解析语义,智能生成对应的数据同步任务配置,包括源端与目标端的数据源类型、表结构映射、字段过滤条件、分区策略及调度参数等。

操作步骤:

  1. 在对话框中输入 / 并选择数据集成Agent

  2. 描述您的数据同步需求,包括源端、目标端、表名以及同步方式等。例如:“帮我创建一个离线同步任务,把MySQL的 ods_user_info_d 表同步到MaxCompute的 ods_user_info_d 表”

  3. Agent 会解析您的需求,并自动填充数据源、表映射等信息来创建数据同步节点。

  4. 创建完成后,您可以点击查看与修改。

操作示例

场景2 - 数据开发Agent

功能描述:提供基于自然语言的ETL开发体验,覆盖需求分析、代码生成、工作流生成到发起发布的全流程。

操作步骤:

  1. 在对话框中输入 / 并选择数据开发Agent

  2. 使用自然语言描述您的数据开发需求,并可按需添加上下文。例如:“构建用户画像分析工作流”。

  3. Agent 会将任务分解为多个步骤(如创建节点、生成代码、配置依赖)执行。

  4. 针对生成的节点代码,您可以查看并选择是否保留或撤销。

操作示例

场景3 - 数据治理Agent

功能描述:DataWorks数据治理Agent,驱动企业数据治理从主动式迈向“自主式”数据治理。数据治理不再是复杂的数据分析和大量的表单配置修改,现在只需通过自然语言指令,转化为精准的治理动作,通过专家级的治理能力进行治理操作的设置,并可进行自动执行。

核心能力

  • 质量规则配置:通过自然语言,帮助用户对指定的重点表,自动配置质量监控规则;数据治理Agent可智能分析指定表的字段类型、业务语义和重要性,自动推荐并配置合理监控规则,如主键唯一性、非空约束、枚举值范围校验等,高效完成以往需要多次探查数据和规则配置的工作。

    • 示例:帮我针对 dim_user_info 这张核心用户维表,自动生成质量规则。

    • 示例:针对ods_开头的表,自动配置表行数相关质量规则。

  • 质量问题治理:针对数据资产治理模块中,已由系统自动发现的待治理的质量问题,如“热门访问表未配置质量规则”,“高基线任务产出表未配置质量规则”等问题,可直接通过自然语言给出治理要求,系统自动分析问题并进行相应治理

    • 示例:找出热门访问表未配置质量规则的表,推荐并配置质量规则。

    • 示例:帮我治理质量维度的问题。

操作示例

  • 质量规则配置

    image.png

  • 质量问题治理

    image.png

场景4 - 数据地图Agent

功能描述:专注于提升数据查找与理解的效率。通过AI驱动的自然语言交互,您可以在海量数据中快速完成元数据多种场景下的探索。

核心能力

  • 自然语言搜索:支持自然语言问答,无需精确关键词,基于业务意图即可快速定位目标数据。例如,“找一下和用户活跃度相关的汇总表”。

  • 自动范围调整:支持在对话中指定范围,Agent将自动理解语义,快速基于该范围进行数据定位。例如,“在adm_bi项目下,查找和业务经营相关的表”。

  • 深度数据理解:支持对目标数据进行追问,快速获取血缘、负责人、字段释义等详细信息。例如,“@dws_bi_metric_di这张表的直接下游有哪些?如果变动后会对哪些负责人有影响?”。

操作示例

相关文档

了解定制化Agent功能,详情请参见基于三方客户端的DataWorks Agent