AI助理服务概述

更新时间:
复制为 MD 格式

AI助理服务是DataWorks基于OpenClaw框架构建的AI智能助手。AI助理服务支持通过DataWorks控制台Web端直接对话,也可以与钉钉、飞书等IM平台打通,在IM端通过自然语言即可完成告警分析、任务诊断、代码修改、任务运维、数据治理等工作。DataWorks提供一键打通资源组与IM端之间的网络、知识库管理、Skill管理、定时任务管理、操作日志审计等能力,帮助您快速构建企业级专属AI助理。

功能概述

AI助理服务是DataWorks集成OpenClaw后推出的专属智能助手。与DataWorks控制台内置的Agent智能体不同,AI助理服务将平台功能延伸到Web端和IM端(钉钉、飞书、企业微信),让您无需在DataWorks控制台内操作即可高效完成各类任务。。

核心价值

  • 多端接入:支持Web端(DataWorks控制台内)和IM端(钉钉、飞书、企业微信群聊),随时随地与AI助理对话。

  • 即时响应:在IM群内直接接收告警并进行AI诊断,告警响应时间从分钟级缩短到秒级。

  • 智能诊断:自动分析任务失败根因、告警影响范围,并提供修复建议。

  • 交互式运维:支持通过自然语言下达运维指令(如重跑任务、修改资源组等),所有写操作均需二次确认。

  • 知识增强:支持自动构建知识库(RAG)和记忆管理,提升AI助理对业务上下文的理解能力。

  • 定时巡检:内置多个定时/触发式任务模板,覆盖SLA监控、资产治理、成本分析等场景,定时推送巡检报告。

  • 数据安全:所有数据在DataWorks平台内流转,AI推理在平台内网完成,敏感数据脱敏后再传给AI,保证数据安全。

开放地域与策略

重要

欢迎加入AI助理服务钉钉交流群,获得更多技术支持。

  • 开放对象:DataWorks基础版及以上规格的客户。

  • 开放地域:华北3(张家口)、华北2(北京)、华北6(乌兰察布)、华东1(杭州)、华东2(上海)、华南1(深圳)、西南1(成都)、中国香港、新加坡、马来西亚(吉隆坡)、印度尼西亚(雅加达)、日本(东京),美国(弗吉尼亚)。

核心能力

AI助理服务通过数据运维Agent,覆盖以下核心场景:

场景

核心能力

示例指令

故障诊断(核心强项)

告警诊断(定位根因/分析上游)、实例诊断(单个/批量)、项目空间健康诊断

诊断任务实例 12345678 失败的原因

任务调度

任务配置查询/修改、实例查询/重跑/终止/置成功、任务冻结/解冻、优先级调整、依赖拓扑查看、资源组迁移

重跑实例 12345678

工作流管理

工作流查询/修改、补数据/冒烟测试、手动触发/启停/重跑、刷新依赖

对工作流 wf-001 执行补数据,时间范围 2026-01-01 到 2026-01-31

监控运维

基线配置/SLA查询、告警规则管理、告警消息查询、值班表/排班查询

查看基线 base_test 的SLA达成情况

数据质量

质量监控规则管理、质量告警规则管理、自动配置质量监控

查询表 ods_user_info 的DQC规则配置

数据治理

标签管理(创建/绑定/解绑)、治理问题/规则查询、资产分析(存储/计算/同步/调度)、资产健康分、治理巡检

查看项目的数据治理评分

项目管理

工作空间列表/详情查询、成员列表/角色列表查询、当前用户信息查询

查看工作空间 xxx 的成员列表

资源管理

资源组列表/详情查询、资源组水位监控

查询资源组 rg-001 的负载情况

说明

AI助理服务当前为只读模式的能力包括:项目管理中的成员权限管理和角色管理、资源管理中的网络配置。AI助理服务暂不支持创建工作空间、创建新任务/节点、删除工作空间/任务等操作。

支持的IM平台

IM平台

所需配置信息

配置参考

钉钉

Client ID、Client Secret

AI助理服务集成钉钉

飞书/Lark

App ID、App Secret

AI助理服务集成飞书

企业微信

Bot ID、Secret

AI助理服务集成企业微信

准备工作

  • 确保您已开通DataWorks Data Agent功能。如未开通,请参见Data Agent 费用

  • 准备一个Serverless资源组,用于运行AI助理服务实例。AI助理服务实例至少需要2CU资源。

  • 如需通过IM端使用,需已在钉钉或飞书上创建了机器人应用,并获取关键配置信息,例如:AppKey/AppSecret(钉钉)或App ID/App Secret(飞书)。

创建实例

重要

仅主账号和具备AliyunDataWorksFullAccess权限的RAM账号具备AI助理服务实例的创建和管理权限。

  1. 登录DataWorks控制台,选择目标地域,在左侧导航栏,单击AI助理服务

  2. AI助理服务页面,单击创建

  3. 新建AI助理服务实例对话框中,配置以下信息:

    参数

    说明

    实例名称

    必填。AI助理服务实例的名称,用于标识和区分不同的实例。名称必须以字母或中文开头,可包含字母、中文、数字、下划线(_)、中划线(-),长度不超过128个字符。

    资源组

    必填。选择用于运行AI助理服务实例的Serverless资源组。AI助理服务实例至少需要2CU资源。

    说明

    如果所选资源组的可用CU数不足以满足AI助理服务实例的资源要求,该资源组将不可选。

    执行身份

    必填。指定AI助理服务访问DataWorks时的身份。如果AI助理仅作为个人助手独自使用,建议配置为当前登录人身份;如果AI助理要分享给多个人使用,建议配置为创建新的RAM角色,可以指定该角色可访问的工作空间和空间角色。

    实例描述

    可选。实例的描述信息,长度不超过256个字符。

  4. 单击确定

    创建实例预计耗时1-3分钟,创建完成后,即可使用AI助理。

管理实例

基本操作

AI助理服务页面,您可以查看和管理已创建的AI助理服务实例。

  • 启动/停止实例:实例创建成功后默认启动。修改了实例配置后,可以停止实例再启动使配置生效。

  • 升级实例:当实例镜像版本低于最新版本时,可单击实例列表镜像列旁的可升级标签将实例升级到最新版本,获得新功能支持。

  • 执行角色管理:修改指定访问身份的访问权限,支持编辑可访问的工作空间列表以及空间角色。

  • 编辑实例:修改实例名称和描述。

  • 删除实例:单击目标实例操作列的删除即可删除实例。

  • 重试:创建或启动失败的实例,可单击重试重新执行操作。

重要

仅实例责任人(Owner)、主账号或拥有FullAccess权限的用户可以编辑或删除实例。

通道配置

AI助理服务支持配置IM端通道,可实现在钉钉、飞书/Lark或企业微信上直接与AI助理进行对话,可让您无需在DataWorks控制台内操作即可完成运维工作。如果不配置IM端渠道,仍可通过Web端使用AI助理。

单击任意一种通道的配置按钮,在弹出的配置框中填入IM端的关键信息:

  • 钉钉:填写Client ID、Client Secret。

  • 飞书/Lark:填写App ID、App Secret。

  • 企业微信:填写Bot ID、Secret。

配置完成后,可单击测试网络连通性验证网络是否打通。若网络未打通,可点击一键网络打通,进行网络配置,当前支持两种方案打通网络:

  • PrivateZone + 私网连接(推荐使用):若资源组配置在专有网络VPC中,且VPC未开通公网,可使用此方法进行网络设置,实现VPC内资源通过纯内网方式访问各IM平台端点,确保流量完全不出公网。

    此方案需要在指定交换机可用区中设置交换机,若交换机未创建,按界面提示创建即可。

  • 开通公网:通过NAT网关 + EIP打通公网,配置简单,但安全性较低。

说明

不同的网络打通方案将产生不同的计费方式,详见:计费说明

Skill管理

Skill(技能)是AI助理可调用的能力扩展模块。通过Skill管理功能,您可以扩展AI助理在数据运维和治理场景中的能力边界。AI助理服务支持系统内置技能和用户自定义技能:系统技能由平台提供并维护,覆盖数据开发辅助和产品问答等场景;自定义技能允许您上传专属的能力模块,满足个性化的业务需求。

单击目标实例名称进入实例详情页,在实例详情页,单击Skill管理Tab。

Skill管理Tab仅在实例镜像版本为v3.0.0及以上时可见。如果未看到该Tab,请先升级实例镜像版本。

系统技能

系统内置技能由DataWorks平台提供和维护,当前包括:

  • 数据开发Skill:支持代码分析、SQL生成等数据开发辅助能力。

  • 全系列产品QA Skill:支持DataWorks产品使用问答。

系统技能不可删除,您可以通过开关控件启用或禁用。

自定义技能

  1. 导入Skill

    1. Skill管理Tab中,单击导入Skill

    2. 在弹出的导入Skill对话框中,配置以下信息:

      参数

      类型

      必填

      说明

      名称

      输入框

      Skill的名称,用于标识和区分。最长64字符。

      描述

      文本框

      Skill的描述信息,帮助理解该Skill的用途。最长256字符。

      Skill文件

      文件上传

      Skill的压缩包文件,仅支持.zip格式。支持拖拽上传。

    3. 配置完成后,单击确认完成导入。

  2. 启用/禁用Skill

    Skill列表中,通过每个Skill卡片上的开关控件实时切换启用或禁用状态。禁用后,AI助理将不再调用该Skill的能力。

  3. 升级Skill

    当系统Skill有新版本可升级时,Skill卡片上会显示可升级标签。

    1. 单击升级按钮。

    2. 系统会自动完成禁用和重新启用的流程,升级后的Skill即生效。

  4. 删除自定义Skill

    Skill列表中,找到需要删除的自定义Skill,单击删除按钮并确认。

系统Skill不可删除,仅自定义Skill支持删除操作。

获取更多Skill

Skill管理Tab中,单击阿里云Skill门户,跳转到阿里云Skill门户页面浏览和获取更多可用的Skill模块。

记忆管理

长期记忆功能帮助您为AI助理实例持久化关键业务上下文。通过记忆管理,您可以将项目资产信息、数据规范、业务流程等重要知识以文件形式保存到AI助理实例中,使其在跨会话交互中保持对这些上下文的理解,从而提供更精准和个性化的运维建议。

AI助理服务列表页,单击目标实例名称进入实例详情页,单击记忆管理页签。

  • 浏览目录:树状目录结构浏览记忆文件,支持进入子目录和返回上一级。

  • 查看文件:单击文件查看内容,对于较大的记忆文件,内容会截断显示,并提示截断信息。

  • 导入记忆:上传文件到指定路径。您可以从本地的openclaw或者其他AI助理服务中导出记忆,实现记忆复用。

  • 导出:支持单文件下载或批量打包导出。

  • 删除:支持单个或批量删除文件。

知识库管理

知识库功能基于RAG(检索增强生成)技术,让AI助理自动理解您的DataWorks项目上下文。知识库会自动从DataWorks工作空间中提取表元数据、任务代码与血缘关系等信息,构建结构化的知识体系,从而为AI助理提供更精准的数据治理和运维建议能力。

AI助理服务列表页,单击目标实例名称进入实例详情页,单击知识库页签,进入知识库管理界面。

生成知识库

首次使用知识库功能时,需要先进行知识库生成。

  1. 在知识库Tab的空状态页面,单击开始生成知识库

  2. 在模式选择弹窗中,选择生成模式:

模式

说明

预计耗时

快速模式

解析元数据schema、任务代码与血缘关系,并进行LLM轻量增强(表的display_name、业务描述、业务域)。

10-20分钟

深度模式(推荐)

包含快速模式全部能力,额外进行数据采样与画像统计(distinct/null/值分布,辅助PII识别)以及LLM深度语义增强(表+列描述、派生指标识别、同义词与术语库聚合)。

小时级(随资产数量浮动)

  1. 确认选择后,系统开始生成知识库,页面进入生成中状态,实时显示进度百分比。

  2. 生成完成后,页面自动切换到知识库浏览模式。

深度模式注意事项:深度模式会触发SQL采样查询(MaxCompute/Spark等),可能产生计算资源消耗。无权限的表将自动跳过。建议在业务低峰期使用深度模式生成知识库。

管理知识库

知识库生成完成后,支持以下操作:

  • 浏览文件:树状目录浏览知识库文件内容。

  • 编辑文件:修改知识库中的文件内容。仅支持编辑自定义上传的文件。

  • 导入文件:上传自定义知识文件,补充AI助理的业务知识。支持上传的文件格式为:.md、.txt、.pdf、.docx、.xlsx、.html、.csv,且不超过10M。

  • 导出文件:单文件直链下载或多文件打包导出。

  • 重新生成:当DataWorks工作空间的元数据发生变化后,您可以重新生成知识库以获取最新的知识上下文。

  • 清空知识库:清除所有已生成的知识库文件。

实例监控

AI助理服务列表页,单击目标实例名称进入实例详情页,单击监控页签,进入实例监控界面。可查看实例的资源使用情况:

  • CPU使用率:已使用CPU /规格总量。

  • 内存使用量:已使用内存/规格总量。

  • 磁盘使用量:已使用磁盘空间/规格总量。

支持选择时间范围查看历史趋势,默认显示最近1小时的数据。

实例日志

AI助理服务列表页,单击目标实例名称进入实例详情页,单击日志页签,进入实例监控界面。可查看实例的资源使用情况:可查询实例运行日志:

  • 支持按子系统筛选日志来源。

  • 支持按关键词搜索日志内容。

  • 支持选择时间范围过滤日志。

使用AI助理服务

使用对话

通过Web端使用AI助理服务

AI助理服务实例创建成功后,在实例列表中单击对话,即可在DataWorks控制台内直接与AI助理对话。

会话管理

Web端支持普通会话和定时任务两种会话管理,左侧会话侧边栏提供以下功能:

普通会话:

  • 新建会话:单击+ 新任务创建新的对话会话。

  • 切换会话:单击会话列表中的会话名称切换到对应会话。

定时任务:

  • 定时/触发式任务:DataWorks内置多种定时任务的模板,您可以选择已有模板,快速启动一个新任务。

对话交互

在对话界面中,您可以通过自然语言与AI助理交互。AI助理会自动调用DataWorks API执行运维操作,所有写操作执行前需要您的确认。

通过IM端使用AI助理服务

  • AI助理服务实例创建成功后,您可以在配置了机器人的群中或与机器人私聊的方式,通过自然语言与AI助理服务交互。

  • 主动提问:在群内@机器人或与机器人私聊,输入您的问题或指令,AI助理服务将自动理解意图并执行对应操作。

    场景

    示例指令

    任务失败诊断

    诊断任务实例 12345678 失败的原因

    告警分析

    分析当前未恢复的告警

    基线SLA查询

    查看基线 base_test 的SLA达成情况

    工作流补数据

    对工作流 wf-001 补数据,时间范围 2026-01-01 到 2026-01-31

    重跑失败任务

    对今天abc工作空间中失败的调度实例执行重跑

  • 自动告警诊断:DataWorks监控规则触发告警时,AI助理服务自动接收告警并进行AI诊断,将诊断结果推送到IM群。

    告诉AI助理服务:帮我开启自动监控告警,推送到当前会话

    AI助理服务 将自动配置告警监听,并将DataWorks触发的告警信息,以消息卡片的形式发送至当前会话。后续,您只需在对话框中通过自然语言指令(如"查看失败日志"、"重跑当前节点"或"回滚至上一版本"),即可直接调用底层API执行运维动作,无需登录控制台,缩短故障修复时间。

  • 开启治理巡检:支持开启自动巡检,AI助理服务将自动执行资产治理巡检工作,并将巡检结果定时推送到IM群。

    告诉AI助理服务:开启自动巡检,推送到当前会话。

    治理巡检默认每日09:30推送巡检结果至IM端,支持通过对话的方式,修改定时推送的时间和频率。同时,也可以向AI助理服务提交更明确的治理项问题,如:"开启治理巡检,间隔3个小时推送一次表负责人为主账号的表个数"以满足个性化需求。

重要

写操作二次确认:所有写操作(如重跑、冻结、删除、修改等)在执行前,AI助理服务会明确展示操作类型、操作对象和涉及数量,必须经过您的明确确认后才会执行。

定时任务

AI助理服务内置多个任务模板,帮助您快速配置定时巡检任务。在Web端对话界面的会话侧边栏中,单击定时任务打开模板面板,选择模板即可创建对应的定时任务会话。

说明

如需要在IM端配置定时任务,可直接使用自然语言让AI助理进行配置。

定时巡检任务模板

以下定时任务模板均默认每日09:00执行,自动生成巡检报告并推送到会话中:

任务名称

说明

SLA基线完成报告

诊断统计今天项目空间下基线整体完成情况,并输出报告

项目空间完成报告

诊断分析项目空间今日任务完成情况,并输出报告

巡检不良资产

统计名下治理问题,分析优先级并输出报告

巡检数据质量

统计高优表未配置数据质量监控的情况,分析并给出建议

每日巡检失败任务根因分析

汇总昨日失败实例并深度诊断Top5高频失败任务

每日巡检资源组水位

识别资源组水位、负载和排队瓶颈,给出扩容或错峰建议

每日巡检慢任务排行

对比历史运行时间,分析运行及等待耗时Top10的异常变慢情况

每日巡检告警规则覆盖盲区

查找关键基线和高优任务的告警覆盖盲区并给出补全建议

每日巡检补数据执行状态

汇总近7天补数据任务状态并分析失败原因

每日巡检未配置生命周期的表

按存储量统计未配置生命周期的表并输出Top20配置建议

每日巡检无主表和废弃资产

扫描长期未访问及无负责人的表,形成候选下线清单

每日巡检代码变更治理合规

检查最近24小时节点变更的治理规则结果并按负责人汇总

每日巡检存储与计算消耗排行

输出存储与计算消耗Top20,并分析增长趋势与优化建议

每日巡检资产编目覆盖率

统计未纳入资产类目的表和占比,并提供编目建议

自定义定时任务

DataWorks也支持自定义定时任务,在Web端单击定时任务,在定时任务右上角单击自定义新建,跟随AI助理的提示,填写定时任务的运行时间间隔和具体的任务内容即可。

计费说明

AI助理服务的费用包含以下部分:

收费项

计费方式

说明

Data Agent席位

按席位购买

使用AI助理服务的前提条件,需先开通Data Agent席位。详情请参见Data Agent 概述

资源组费用

按量计费(按时长)

AI助理服务实例运行所消耗的资源组CU费用。若资源组需要进行网络打通,还会产生相应的网络费用:

PrivateZone + 私网连接:PrivateZone(产品计费)、终端节点(私网连接计费说明)。

开通公网:NAT(NAT 网关计费)。

AI推理

Token使用量计费

AI助理服务调用AI模型进行智能诊断和分析的费用。详情请参见Data Agent 费用

DataWorks Agent的区别

对比项

DataWorks Agent

AI助理服务

使用入口

DataWorks控制台内(Data Studio页面)

Web端(DataWorks控制台AI助理服务页面)和IM端(钉钉、飞书、企业微信群聊)

主要场景

数据开发、数据集成、数据治理等全场景

运维场景(告警诊断、任务管理、基线监控等)以及数据治理场景

交互方式

浏览器内DataAgent对话框

Web端专属对话界面或IM群聊中@AI助理

告警集成

不支持

支持接收告警并自动AI诊断

知识库

不支持

支持构建工作空间级知识库(RAG)

定时任务

不支持

支持定时巡检和触发式任务

自定义技能

不支持

支持导入和管理自定义Skill

AI助理服务钉钉交流群

您需要先单击申请链接加入"阿里云大数据AI平台"组织,再扫描下方二维码加入AI助理服务产品钉钉交流群,加入后,即可获得专属产品技术支持!

image