DataWorks Agent基于MCP协议(模型上下文协议),可对接DataWorks MCP Server及其他大数据MCP Server(如Hologres MCP Server),旨在通过自然语言交互在DataWorks中实现数据开发、任务运维和数据集成等能力。
功能介绍
DataWorks Agent支持通过自然语言交互方式,在智能对话窗口实现大数据开发。它的主要原理如下:DataWorks Agent通过大语言模型(LLM)解析需求,并智能调用MCP Server能力完成任务执行。
例如,您可通过DataWorks Agent对话窗口输入“我有几个工作空间”,Agent会通过LLM解析并调用内置DataWorks OpenAPI的DataWorks MCP Server提供的ListProjects工具查询,并返回结果。当任务较复杂时,LLM将与MCP Server进行多次交互。
DataWorks Agent不仅集成DataWorks MCP Server,还支持接入其他MCP Server。您也可按需选择自己的LLM(比如通义千问、DeepSeek、OpenAI等)。
您也可输入如下提问,体验更多DataWorks Agent支持的任务场景。
适用范围 | 示例提问 |
适用范围 | 示例提问 |
数据开发 | 【查询任务】查询本工作空间项目目录下所有调度类型为暂停的 |
【重命名任务】帮我把上述节点的名字修改为:无效节点_待删除,多个节点可以用序号来区分。 | |
【创建任务】帮我在本工作空间项目目录下创建5个 | |
任务运维 | 【重跑失败任务】查看本工作空间, |
【查询失败实例】查看本工作空间项目下, | |
【分析任务重跑属性】分析这些任务的重跑属性,是否可重跑,如可重跑,则重跑任务。 | |
数据集成 | 【同步MySQL单表至MaxCompute】请在当前空间下新建一个 |
【销量分析】帮我分析order表这个月前10销量商品的销量走向。 |
使用限制
该功能仅支持在个人开发环境中使用。
个人开发环境重启后,需要重新安装MCP Server功能,请谨慎操作。
该功能仅支持在参加数据开发(Data Studio)(新版)公测的工作空间使用。
计费说明
使用DataWorks Agent将产生OpenAPI调用费用和模型Token计费。
快速体验DataWorks Agent
当您完成DataWorks Agent配置后,单击Cline页右上角的图标,进入DataWorks Agent对话界面快速体验:创建ODPS SQL任务。
您只需输入提问:帮我在本工作空间项目目录下创建5个odps_sql
节点,名称以MCP_Demo
开头,中间下划线连接,末尾以01开始的数字自增结束。
Agent拆解步骤并运行:
分析需要调用
CreateNode
接口,但缺少工作空间ID,让用户手动输入。调用
CreateNode
接口,创建5个ODPS_SQL节点。CreateNode
接口调用成功,返回了一个请求ID和节点ID。调用
ListNodes
接口来列出工作空间中的节点,确认创建成功。运行过程中系统会提示您确认并获取一些相关信息。您可以单击Approve同意该操作,或者单击Reject拒绝该操作。
每次运行关键步骤拆解过程可能稍有不同,不同LLM解析也会不同,具体以实际情况为主。
运行完成之后,您将得到5个MCP_Demo
开头的ODPS_SQL节点。
配置DataWorks Agent
DataWorks Agent通过MCP Client插件(如Cline)搭建前端对话窗口,通过MCP Server配置接入DataWorks MCP Server等阿里云MCP Server。
您可按需接入更多开源MCP Server,以增强DataWorks Agent的能力。
前提条件
已创建工作空间,并选择参加数据开发(Data Studio)(新版)公测。
(可选,RAM账号需要)进行任务开发的RAM账号已被添加至对应工作空间中,并具有开发或空间管理员(权限较大,谨慎添加)角色权限,添加成员的操作详情请参见为工作空间添加空间成员。
如果您使用的是主账号,则可忽略该添加操作。
在创建个人开发环境实例时,如果您选择的镜像是
dataworks-mcp:py3.11-ubuntu22.04
,则在步骤二:配置Agent时无需升级程序引擎和安装Cline扩展程序。如您的个人开发环境需要绑定VPC,您需配置个人开发环境通过专有公网网关访问公网。
步骤一:准备个人开发环境
您可通过以下步骤,启用并进入个人开发环境。
进入DataWorks工作空间列表页,在顶部切换至目标地域,找到已创建的工作空间,单击操作列的 ,进入Data Studio。
单击顶部导航栏个人开发环境·请选择旁边的
图标,检查您创建的个人开发环境实例的状态并进入个人开发环境。
状态为运行中:单击个人开发环境·请选择中正在运行的个人开发环境,进入个人开发环境欢迎页。
状态为其它状态:单击弹窗中的管理环境,在个人开发环境实例页面找到您创建的实例,单击操作栏中的启动按钮,等待实例状态变为运行中。单击个人开发环境·请选择中正在运行的个人开发环境,进入个人开发环境欢迎页。
当个人开发环境·请选择区域出现类似这个
图标时,表示您已成功进入个人开发环境。
步骤二:配置Agent
进入个人开发环境后,您可以按照以下步骤配置DataWorks Agent。本文将以Cline为例进行说明。
(可选)升级程序引擎
如果您使用的是之前的个人开发环境,或者已经在个人开发环境中安装过Cline扩展程序,您需要按照以下方法来升级现有的底层引擎,以便使用扩展程序功能。已进行升级操作可跳过该步骤。
一键升级:进入个人开发环境后,如果遇到提示底层引擎升级适配的弹窗,请单击一键升级按钮来完成底层引擎的适配升级。
命令升级:单击页面底部工具栏左侧的图标,进入终端命令栏,在命令栏中输入以下升级命令,单击回车进行升级。
wget https://nodejs.org/dist/v20.19.0/node-v20.19.0-linux-x64.tar.xz
tar xf node-v20.19.0-linux-x64.tar.xz
mv /etc/dsw/node /etc/dsw/node14
mv node-v20.19.0-linux-x64 /etc/dsw/node
bash <(curl -s https://dataworks-notebook-${REGION}.oss-${REGION}.aliyuncs.com/public-datasets/aone-release/dwcode-server/scripts/update.sh) 0.2.169
升级完成后,请在弹窗中单击重新加载窗口以应用最新的更改。
安装Cline扩展程序
您可根据以下步骤,在个人开发环境安装扩展程序Cline,作为您的Agent对话窗口。
单击个人开发环境欢迎页左侧导航栏的
图标,进入程序扩展页。
在程序扩展页的搜索框中输入
Cline
。找到下方出现的扩展程序Cline。
单击Cline程序右下方的安装,等待程序安装完成。
安装完Cline程序后,您可以通过右键单击左侧导航栏的
图标,根据个人喜好配置键绑定、将插件程序 或 。
配置LLM的API Key
安装完Cline扩展程序后,请按照以下步骤配置API Key信息。这里将以使用OpenAI Compatible模式连接百炼API为例进行配置说明。
其它模式连接模型,请根据界面实际参数进行相关配置。
目前仅支持Use your own API key配置方式,不支持Get Started for Free配置方式。
单击个人开发环境欢迎页左侧导航栏的
图标,进入Cline页。
单击Cline页中的Use your own API key,根据下表参数说明进行相关配置。
参数
说明
参数
说明
API Provider
指定您要使用的API服务提供商,选择
OpenAI Compatible
。这表示您将使用与OpenAI API兼容的接口来连接百炼API。Base URL
API服务的基础URL,用于指定API请求的根地址。
例如百炼API提供的与OpenAI兼容的API端点地址:
https://dashscope.aliyuncs.com/compatible-mode/v1
。API Key
用于身份验证的密钥,确保您的请求是合法的。
从阿里云百炼控制台获取的API Key。
Model ID
指定您要使用的具体模型。不同的模型可能具有不同的功能和性能。
选择
qwen-coder-plus
或qwen-plus
。这两个选项分别代表不同的预训练模型:qwen-coder-plus
:适用于代码生成和编程任务。qwen-plus
:适用于通用文本生成和处理任务。
单击下方的Let's go!按钮,完成API Key的配置。
接入MCP Server
完成API Key的配置后,您可根据以下步骤完成MCP Server的相关配置。
单击Cline页右上角的
图标,进入MCP Server的Marketplace页签。
单击切换至Installed页签。
单击Configure MCP Servers,您可按需在此配置多个MCP Server。请在右侧的配置文件中填写以下配置信息。
若您需在DataWorks Agent中使用Hologres能力,请接入Hologres MCP Server。
{ "mcpServers": { "alibabacloud-dataworks-mcp-server": { "command": "npx", "args": [ "alibabacloud-dataworks-mcp-server" ], "env": { "REGION":"cn-beijing", "ALIBABA_CLOUD_CREDENTIALS_URI":"http://localhost:7002/api/v1/credentials/0" }, "disabled": false, "autoApprove": [], "timeout": 60 } } }
参数
说明
参数
说明
command
此处填写npx,表示dataworks-mcp-server提供的指令方式。
args
此处填写npm包名alibabacloud-dataworks-mcp-server,表示dataworks-mcp-server的指令参数。
env
REGION
您所在地域,在实际使用过程中,请将
REGION
参数设置为您所在的地域标识。ALIBABA_CLOUD_CREDENTIALS_URI
指定阿里云凭证的URI。
该参数仅在DataWorks个人开发环境生效,用于获取阿里云用户身份认证。
TOOL_CATEGORIES
配置
Tool
分类的白名单。请在此处填写OpenAPI的分类,多个分类之间用半角逗号分隔。例如:
"TOOL_CATEGORIES":"数据源,空间管理,资源组管理,数据地图,数据集成,数据开发(新版),运维中心,数据服务,开放平台,数据质量,标签管理,安全中心,SERVER_IDE_DEFAULT"
。SERVER_IDE_DEFAULT
为个人开发环境上的默认Tools
,其他业务分类(数据源,空间管理,资源组管理,数据地图,数据集成,数据开发(新版),运维中心,数据服务,开放平台,数据质量,标签管理,安全中心)可在大数据开发治理平台 DataWorks - OpenAPI 概览页的左侧目录树中查看。TOOL_NAMES
配置
Tool
名字的白名单。请在此处填写OpenAPI的名字,多个名字之间用半角逗号分隔。例如:
"TOOL_NAMES":"ListProjects,CreateNode,UpdateNode"
。TOOL_NAMES
可在大数据开发治理平台 DataWorks - OpenAPI 概览中查看。编辑完配置信息后,请按
Ctrl+S
保存并加载您所配置的MCP Server信息。看到如下加载成功的Tools可确认
alibabacloud-dataworks-mcp-server
已安装成功,即可开始使用DataWorks MCP Server功能。如果未能加载出以下信息,请确认是否已升级引擎。
常见问题
在MCP服务器上执行预设提问时,如果API Request长时间处于运行状态而没有响应,这可能是因为您的程序引擎版本较低,与当前系统存在兼容性问题。为解决这一状况,您需升级程序引擎。
如果模型响应慢,可以减少启用的MCP Server数量,或在接入MCP Server的配置文件
env
参数中增加TOOL_CATEGORIES
和TOOL_NAMES
,以减少引入的Tool
数量。
附录:DataWorks MCP Server
MCP(Model Context Protocol)是一种为大型语言模型(LLM)提供标准化上下文的协议。它定义了一种标准方式,使得大模型能够连接不同的数据源和工具,从而更有效地理解和处理信息。MCP客户端通过MCP协议,可调用各种MCP Server的能力。
DataWorks MCP Server作为一种MCP Server,封装DataWorks OpenAPI,拥有DataWorks大数据处理能力。您可在第三方产品、程序、Agent接入DataWorks MCP Server,实现对DataWorks的能力快速调用。
当您不在DataWorks个人开发环境使用时,需要在参数env中配置ALIBABA_CLOUD_ACCESS_KEY_ID和ALIBABA_CLOUD_ACCESS_KEY_SECRET(请在此处获取),同时删除配置ALIBABA_CLOUD_CREDENTIALS_URI。
- 本页导读 (1)
- 功能介绍
- 使用限制
- 计费说明
- 快速体验DataWorks Agent
- 配置DataWorks Agent
- 前提条件
- 步骤一:准备个人开发环境
- 步骤二:配置Agent
- 常见问题
- 附录:DataWorks MCP Server