DataWorks Agent

更新时间:2025-04-23 10:15:10

DataWorks Agent基于MCP协议(模型上下文协议),可对接DataWorks MCP Server及其他大数据MCP Server(如Hologres MCP Server),旨在通过自然语言交互在DataWorks中实现数据开发、任务运维和数据集成等能力。

功能介绍

DataWorks Agent支持通过自然语言交互方式,在智能对话窗口实现大数据开发。它的主要原理如下:DataWorks Agent通过大语言模型(LLM)解析需求,并智能调用MCP Server能力完成任务执行。

例如,您可通过DataWorks Agent对话窗口输入“我有几个工作空间”,Agent会通过LLM解析并调用内置DataWorks OpenAPIDataWorks MCP Server提供的ListProjects工具查询,并返回结果。当任务较复杂时,LLM将与MCP Server进行多次交互。

DataWorks Agent不仅集成DataWorks MCP Server,还支持接入其他MCP Server。您也可按需选择自己的LLM(比如通义千问、DeepSeek、OpenAI等)。

image

您也可输入如下提问,体验更多DataWorks Agent支持的任务场景。

适用范围

示例提问

适用范围

示例提问

数据开发

【查询任务】查询本工作空间项目目录下所有调度类型为暂停的odps sql数据开发节点。

【重命名任务】帮我把上述节点的名字修改为:无效节点_待删除,多个节点可以用序号来区分。

【创建任务】帮我在本工作空间项目目录下创建5odps_sql节点,名称以MCP_Demo开头,中间下划线连接,末尾以01开始的数字自增结束。

任务运维

【重跑失败任务】查看本工作空间,20250330日运行失败的任务,并重跑这些实例。注意bizdate是毫秒级别的时间戳。

【查询失败实例】查看本工作空间项目下,20250331日状态为失败的实例,bizdate的格式为毫秒级的时间戳。

【分析任务重跑属性】分析这些任务的重跑属性,是否可重跑,如可重跑,则重跑任务。

数据集成

【同步MySQL单表至MaxCompute】请在当前空间下新建一个mcp_test_mysql同步到mcp_test_maxcompute的单表离线同步任务,资源组使用mcp_test_res,同步mcp_test_mysql数据源下的库为test_db下的users这张表至mcp_test_maxcompute的同名表中,字段映射采取同名映射的方式。然后运行此任务。告诉我这个任务同步的状态。

数据分析

【销量分析】帮我分析order表这个月前10销量商品的销量走向。

使用限制

  • 该功能仅支持在个人开发环境中使用。

    重要

    个人开发环境重启后,需要重新安装MCP Server功能,请谨慎操作。

  • 该功能仅支持在参加数据开发(Data Studio)(新版)公测的工作空间使用。

计费说明

使用DataWorks Agent将产生OpenAPI调用费用模型Token计费

快速体验DataWorks Agent

当您完成DataWorks Agent配置后,单击Cline页右上角的image图标,进入DataWorks Agent对话界面快速体验:创建ODPS SQL任务。

image

您只需输入提问:帮我在本工作空间项目目录下创建5odps_sql节点,名称以MCP_Demo开头,中间下划线连接,末尾以01开始的数字自增结束。

Agent拆解步骤并运行:

  1. 分析需要调用CreateNode接口,但缺少工作空间ID,让用户手动输入。

  2. 调用CreateNode接口,创建5ODPS_SQL节点。

  3. CreateNode接口调用成功,返回了一个请求ID和节点ID。

  4. 调用ListNodes接口来列出工作空间中的节点,确认创建成功。

    说明
    • 运行过程中系统会提示您确认并获取一些相关信息。您可以单击Approve同意该操作,或者单击Reject拒绝该操作。

    • 每次运行关键步骤拆解过程可能稍有不同,不同LLM解析也会不同,具体以实际情况为主。

运行完成之后,您将得到5MCP_Demo开头的ODPS_SQL节点。

image

配置DataWorks Agent

DataWorks Agent通过MCP Client插件(如Cline)搭建前端对话窗口,通过MCP Server配置接入DataWorks MCP Server阿里云MCP Server

说明

您可按需接入更多开源MCP Server,以增强DataWorks Agent的能力。

前提条件

步骤一:准备个人开发环境

您可通过以下步骤,启用并进入个人开发环境。

  1. 进入DataWorks工作空间列表页,在顶部切换至目标地域,找到已创建的工作空间,单击操作列的快速进入 > Data Studio,进入Data Studio。

  2. 单击顶部导航栏个人开发环境·请选择旁边的image图标,检查您创建的个人开发环境实例的状态并进入个人开发环境。

    • 状态为运行中:单击个人开发环境·请选择中正在运行的个人开发环境,进入个人开发环境欢迎页

    • 状态为其它状态:单击弹窗中的管理环境,在个人开发环境实例页面找到您创建的实例,单击操作栏中的启动按钮,等待实例状态变为运行中。单击个人开发环境·请选择中正在运行的个人开发环境,进入个人开发环境欢迎页

    说明

    个人开发环境·请选择区域出现类似这个image图标时,表示您已成功进入个人开发环境。

步骤二:配置Agent

进入个人开发环境后,您可以按照以下步骤配置DataWorks Agent。本文将以Cline为例进行说明。

(可选)升级程序引擎

如果您使用的是之前的个人开发环境,或者已经在个人开发环境中安装过Cline扩展程序,您需要按照以下方法来升级现有的底层引擎,以便使用扩展程序功能。已进行升级操作可跳过该步骤。

一键升级:进入个人开发环境后,如果遇到提示底层引擎升级适配的弹窗,请单击一键升级按钮来完成底层引擎的适配升级。

命令升级:单击页面底部工具栏左侧的image图标,进入终端命令栏,在命令栏中输入以下升级命令,单击回车进行升级。

wget https://nodejs.org/dist/v20.19.0/node-v20.19.0-linux-x64.tar.xz
tar xf node-v20.19.0-linux-x64.tar.xz
mv /etc/dsw/node /etc/dsw/node14
mv node-v20.19.0-linux-x64 /etc/dsw/node

bash <(curl -s https://dataworks-notebook-${REGION}.oss-${REGION}.aliyuncs.com/public-datasets/aone-release/dwcode-server/scripts/update.sh)  0.2.169

升级完成后,请在弹窗中单击重新加载窗口以应用最新的更改。

安装Cline扩展程序

您可根据以下步骤,在个人开发环境安装扩展程序Cline,作为您的Agent对话窗口。

  1. 单击个人开发环境欢迎页左侧导航栏的image图标,进入程序扩展页。

  2. 在程序扩展页的搜索框中输入Cline

  3. 找到下方出现的扩展程序Cline。

  4. 单击Cline程序右下方的安装,等待程序安装完成。

  5. 安装完Cline程序后,您可以通过右键单击左侧导航栏的image图标,根据个人喜好配置键绑定、将插件程序移动到 > 辅助侧边栏移动到 > 面板

配置LLMAPI Key

安装完Cline扩展程序后,请按照以下步骤配置API Key信息。这里将以使用OpenAI Compatible模式连接百炼API为例进行配置说明。

说明
  • 其它模式连接模型,请根据界面实际参数进行相关配置。

  • 目前仅支持Use your own API key配置方式,不支持Get Started for Free配置方式。

  1. 单击个人开发环境欢迎页左侧导航栏的image图标,进入Cline页。

  2. 单击Cline页中的Use your own API key,根据下表参数说明进行相关配置。

    参数

    说明

    参数

    说明

    API Provider

    指定您要使用的API服务提供商,选择OpenAI Compatible。这表示您将使用与OpenAI API兼容的接口来连接百炼API。

    Base URL

    API服务的基础URL,用于指定API请求的根地址。

    例如百炼API提供的与OpenAI兼容的API端点地址:https://dashscope.aliyuncs.com/compatible-mode/v1

    API Key

    用于身份验证的密钥,确保您的请求是合法的。

    阿里云百炼控制台获取的API Key。

    Model ID

    指定您要使用的具体模型。不同的模型可能具有不同的功能和性能。

    选择qwen-coder-plusqwen-plus。这两个选项分别代表不同的预训练模型:

    • qwen-coder-plus:适用于代码生成和编程任务。

    • qwen-plus:适用于通用文本生成和处理任务。

  3. 单击下方的Let's go!按钮,完成API Key的配置。

接入MCP Server

完成API Key的配置后,您可根据以下步骤完成MCP Server的相关配置。

  1. 单击Cline页右上角的image图标,进入MCP ServerMarketplace页签。

  2. 单击切换至Installed页签。

  3. 单击Configure MCP Servers,您可按需在此配置多个MCP Server。请在右侧的配置文件中填写以下配置信息。

    说明

    若您需在DataWorks Agent中使用Hologres能力,请接入Hologres MCP Server

    {
      "mcpServers": {
        "alibabacloud-dataworks-mcp-server": {
          "command": "npx",
          "args": [
            "alibabacloud-dataworks-mcp-server"
          ],
          "env": {
            "REGION":"cn-beijing", 
            "ALIBABA_CLOUD_CREDENTIALS_URI":"http://localhost:7002/api/v1/credentials/0"
          },
          "disabled": false,
          "autoApprove": [],
          "timeout": 60
        }
      }
    }

    参数

    说明

    参数

    说明

    command

    此处填写npx,表示dataworks-mcp-server提供的指令方式。

    args

    此处填写npm包名alibabacloud-dataworks-mcp-server,表示dataworks-mcp-server的指令参数。

    env

    REGION

    您所在地域,在实际使用过程中,请将REGION参数设置为您所在的地域标识

    ALIBABA_CLOUD_CREDENTIALS_URI

    指定阿里云凭证的URI。

    重要

    该参数仅在DataWorks个人开发环境生效,用于获取阿里云用户身份认证。

    TOOL_CATEGORIES

    配置Tool分类的白名单。请在此处填写OpenAPI的分类,多个分类之间用半角逗号分隔。

    例如:"TOOL_CATEGORIES":"数据源,空间管理,资源组管理,数据地图,数据集成,数据开发(新版),运维中心,数据服务,开放平台,数据质量,标签管理,安全中心,SERVER_IDE_DEFAULT"

    说明

    SERVER_IDE_DEFAULT为个人开发环境上的默认Tools,其他业务分类(数据源,空间管理,资源组管理,数据地图,数据集成,数据开发(新版),运维中心,数据服务,开放平台,数据质量,标签管理,安全中心)可在大数据开发治理平台 DataWorks - OpenAPI 概览页的左侧目录树中查看。

    TOOL_NAMES

    配置Tool名字的白名单。请在此处填写OpenAPI的名字,多个名字之间用半角逗号分隔。

    例如:"TOOL_NAMES":"ListProjects,CreateNode,UpdateNode"

  4. 编辑完配置信息后,请按Ctrl+S保存并加载您所配置的MCP Server信息。

  5. 看到如下加载成功的Tools可确认alibabacloud-dataworks-mcp-server已安装成功,即可开始使用DataWorks MCP Server功能。

    说明

    如果未能加载出以下信息,请确认是否已升级引擎

    image

常见问题

  • MCP服务器上执行预设提问时,如果API Request长时间处于运行状态而没有响应,这可能是因为您的程序引擎版本较低,与当前系统存在兼容性问题。为解决这一状况,您需升级程序引擎

  • 如果模型响应慢,可以减少启用的MCP Server数量,或在接入MCP Server的配置文件env参数中增加TOOL_CATEGORIESTOOL_NAMES,以减少引入的Tool数量。

附录:DataWorks MCP Server

MCP(Model Context Protocol)是一种为大型语言模型(LLM)提供标准化上下文的协议。它定义了一种标准方式,使得大模型能够连接不同的数据源和工具,从而更有效地理解和处理信息。MCP客户端通过MCP协议,可调用各种MCP Server的能力。

DataWorks MCP Server作为一种MCP Server,封装DataWorks OpenAPI,拥有DataWorks大数据处理能力。您可在第三方产品、程序、Agent接入DataWorks MCP Server,实现对DataWorks的能力快速调用。

重要

当您不在DataWorks个人开发环境使用时,需要在参数env中配置ALIBABA_CLOUD_ACCESS_KEY_IDALIBABA_CLOUD_ACCESS_KEY_SECRET(请在此处获取),同时删除配置ALIBABA_CLOUD_CREDENTIALS_URI

image

  • 本页导读 (1)
  • 功能介绍
  • 使用限制
  • 计费说明
  • 快速体验DataWorks Agent
  • 配置DataWorks Agent
  • 前提条件
  • 步骤一:准备个人开发环境
  • 步骤二:配置Agent
  • 常见问题
  • 附录:DataWorks MCP Server
AI助理

点击开启售前

在线咨询服务

你好,我是AI助理

可以解答问题、推荐解决方案等