AI助理服务是DataWorks基于OpenClaw框架构建的AI智能助手。AI助理服务支持通过DataWorks控制台Web端直接对话,也可以与钉钉、飞书等IM平台打通,在IM端通过自然语言即可完成告警分析、任务诊断、代码修改、任务运维、数据治理等工作。DataWorks提供一键打通资源组与IM端之间的网络、知识库管理、Skill管理、定时任务管理、操作日志审计等能力,帮助您快速构建企业级专属AI助理。
功能概述
AI助理服务是DataWorks集成OpenClaw后推出的专属智能助手。与DataWorks控制台内置的Agent智能体不同,AI助理服务将平台功能延伸到Web端和IM端(钉钉、飞书、企业微信),让您无需在DataWorks控制台内操作即可高效完成各类任务。。
核心价值
多端接入:支持Web端(DataWorks控制台内)和IM端(钉钉、飞书、企业微信群聊),随时随地与AI助理对话。
即时响应:在IM群内直接接收告警并进行AI诊断,告警响应时间从分钟级缩短到秒级。
智能诊断:自动分析任务失败根因、告警影响范围,并提供修复建议。
交互式运维:支持通过自然语言下达运维指令(如重跑任务、修改资源组等),所有写操作均需二次确认。
知识增强:支持自动构建知识库(RAG)和记忆管理,提升AI助理对业务上下文的理解能力。
定时巡检:内置多个定时/触发式任务模板,覆盖SLA监控、资产治理、成本分析等场景,定时推送巡检报告。
数据安全:所有数据在DataWorks平台内流转,AI推理在平台内网完成,敏感数据脱敏后再传给AI,保证数据安全。
开放地域与策略
欢迎加入AI助理服务钉钉交流群,获得更多技术支持。
开放对象:DataWorks基础版及以上规格的客户。
开放地域:华北3(张家口)、华北2(北京)、华北6(乌兰察布)、华东1(杭州)、华东2(上海)、华南1(深圳)、西南1(成都)、中国香港、新加坡、马来西亚(吉隆坡)、印度尼西亚(雅加达)、日本(东京),美国(弗吉尼亚)。
核心能力
AI助理服务通过数据运维Agent,覆盖以下核心场景:
场景 | 核心能力 | 示例指令 |
故障诊断(核心强项) | 告警诊断(定位根因/分析上游)、实例诊断(单个/批量)、项目空间健康诊断 |
|
任务调度 | 任务配置查询/修改、实例查询/重跑/终止/置成功、任务冻结/解冻、优先级调整、依赖拓扑查看、资源组迁移 |
|
工作流管理 | 工作流查询/修改、补数据/冒烟测试、手动触发/启停/重跑、刷新依赖 |
|
监控运维 | 基线配置/SLA查询、告警规则管理、告警消息查询、值班表/排班查询 |
|
数据质量 | 质量监控规则管理、质量告警规则管理、自动配置质量监控 |
|
数据治理 | 标签管理(创建/绑定/解绑)、治理问题/规则查询、资产分析(存储/计算/同步/调度)、资产健康分、治理巡检 |
|
项目管理 | 工作空间列表/详情查询、成员列表/角色列表查询、当前用户信息查询 |
|
资源管理 | 资源组列表/详情查询、资源组水位监控 |
|
AI助理服务当前为只读模式的能力包括:项目管理中的成员权限管理和角色管理、资源管理中的网络配置。AI助理服务暂不支持创建工作空间、创建新任务/节点、删除工作空间/任务等操作。
支持的IM平台
IM平台 | 所需配置信息 | 配置参考 |
钉钉 | Client ID、Client Secret | |
飞书/Lark | App ID、App Secret | |
企业微信 | Bot ID、Secret |
准备工作
确保您已开通DataWorks Data Agent功能。如未开通,请参见Data Agent 费用。
准备一个Serverless资源组,用于运行AI助理服务实例。AI助理服务实例至少需要2CU资源。
如需通过IM端使用,需已在钉钉或飞书上创建了机器人应用,并获取关键配置信息,例如:AppKey/AppSecret(钉钉)或App ID/App Secret(飞书)。
创建实例
仅主账号和具备AliyunDataWorksFullAccess权限的RAM账号具备AI助理服务实例的创建和管理权限。
登录DataWorks控制台,选择目标地域,在左侧导航栏,单击AI助理服务。
在AI助理服务页面,单击创建。
在新建AI助理服务实例对话框中,配置以下信息:
参数
说明
实例名称
必填。AI助理服务实例的名称,用于标识和区分不同的实例。名称必须以字母或中文开头,可包含字母、中文、数字、下划线(_)、中划线(-),长度不超过128个字符。
资源组
必填。选择用于运行AI助理服务实例的Serverless资源组。AI助理服务实例至少需要2CU资源。
说明如果所选资源组的可用CU数不足以满足AI助理服务实例的资源要求,该资源组将不可选。
执行身份
必填。指定AI助理服务访问DataWorks时的身份。如果AI助理仅作为个人助手独自使用,建议配置为当前登录人身份;如果AI助理要分享给多个人使用,建议配置为创建新的RAM角色,可以指定该角色可访问的工作空间和空间角色。
实例描述
可选。实例的描述信息,长度不超过256个字符。
单击确定。
创建实例预计耗时1-3分钟,创建完成后,即可使用AI助理。
管理实例
基本操作
在AI助理服务页面,您可以查看和管理已创建的AI助理服务实例。
启动/停止实例:实例创建成功后默认启动。修改了实例配置后,可以停止实例再启动使配置生效。
升级实例:当实例镜像版本低于最新版本时,可单击实例列表镜像列旁的可升级标签将实例升级到最新版本,获得新功能支持。
执行角色管理:修改指定访问身份的访问权限,支持编辑可访问的工作空间列表以及空间角色。
编辑实例:修改实例名称和描述。
删除实例:单击目标实例操作列的删除即可删除实例。
重试:创建或启动失败的实例,可单击重试重新执行操作。
仅实例责任人(Owner)、主账号或拥有FullAccess权限的用户可以编辑或删除实例。
通道配置
AI助理服务支持配置IM端通道,可实现在钉钉、飞书/Lark或企业微信上直接与AI助理进行对话,可让您无需在DataWorks控制台内操作即可完成运维工作。如果不配置IM端渠道,仍可通过Web端使用AI助理。
单击任意一种通道的配置按钮,在弹出的配置框中填入IM端的关键信息:
钉钉:填写Client ID、Client Secret。
飞书/Lark:填写App ID、App Secret。
企业微信:填写Bot ID、Secret。
配置完成后,可单击测试网络连通性验证网络是否打通。若网络未打通,可点击一键网络打通,进行网络配置,当前支持两种方案打通网络:
PrivateZone + 私网连接(推荐使用):若资源组配置在专有网络VPC中,且VPC未开通公网,可使用此方法进行网络设置,实现VPC内资源通过纯内网方式访问各IM平台端点,确保流量完全不出公网。
此方案需要在指定交换机可用区中设置交换机,若交换机未创建,按界面提示创建即可。
开通公网:通过NAT网关 + EIP打通公网,配置简单,但安全性较低。
不同的网络打通方案将产生不同的计费方式,详见:计费说明。
Skill管理
Skill(技能)是AI助理可调用的能力扩展模块。通过Skill管理功能,您可以扩展AI助理在数据运维和治理场景中的能力边界。AI助理服务支持系统内置技能和用户自定义技能:系统技能由平台提供并维护,覆盖数据开发辅助和产品问答等场景;自定义技能允许您上传专属的能力模块,满足个性化的业务需求。
单击目标实例名称进入实例详情页,在实例详情页,单击Skill管理Tab。
Skill管理Tab仅在实例镜像版本为v3.0.0及以上时可见。如果未看到该Tab,请先升级实例镜像版本。
系统技能
系统内置技能由DataWorks平台提供和维护,当前包括:
数据开发Skill:支持代码分析、SQL生成等数据开发辅助能力。
全系列产品QA Skill:支持DataWorks产品使用问答。
系统技能不可删除,您可以通过开关控件启用或禁用。
自定义技能
导入Skill
在Skill管理Tab中,单击导入Skill。
在弹出的导入Skill对话框中,配置以下信息:
参数
类型
必填
说明
名称
输入框
是
Skill的名称,用于标识和区分。最长64字符。
描述
文本框
否
Skill的描述信息,帮助理解该Skill的用途。最长256字符。
Skill文件
文件上传
是
Skill的压缩包文件,仅支持.zip格式。支持拖拽上传。
配置完成后,单击确认完成导入。
启用/禁用Skill
在Skill列表中,通过每个Skill卡片上的开关控件实时切换启用或禁用状态。禁用后,AI助理将不再调用该Skill的能力。
升级Skill
当系统Skill有新版本可升级时,Skill卡片上会显示可升级标签。
单击升级按钮。
系统会自动完成禁用和重新启用的流程,升级后的Skill即生效。
删除自定义Skill
在Skill列表中,找到需要删除的自定义Skill,单击删除按钮并确认。
系统Skill不可删除,仅自定义Skill支持删除操作。
获取更多Skill
在Skill管理Tab中,单击阿里云Skill门户,跳转到阿里云Skill门户页面浏览和获取更多可用的Skill模块。
记忆管理
长期记忆功能帮助您为AI助理实例持久化关键业务上下文。通过记忆管理,您可以将项目资产信息、数据规范、业务流程等重要知识以文件形式保存到AI助理实例中,使其在跨会话交互中保持对这些上下文的理解,从而提供更精准和个性化的运维建议。
在AI助理服务列表页,单击目标实例名称进入实例详情页,单击记忆管理页签。
浏览目录:树状目录结构浏览记忆文件,支持进入子目录和返回上一级。
查看文件:单击文件查看内容,对于较大的记忆文件,内容会截断显示,并提示截断信息。
导入记忆:上传文件到指定路径。您可以从本地的openclaw或者其他AI助理服务中导出记忆,实现记忆复用。
导出:支持单文件下载或批量打包导出。
删除:支持单个或批量删除文件。
知识库管理
知识库功能基于RAG(检索增强生成)技术,让AI助理自动理解您的DataWorks项目上下文。知识库会自动从DataWorks工作空间中提取表元数据、任务代码与血缘关系等信息,构建结构化的知识体系,从而为AI助理提供更精准的数据治理和运维建议能力。
在AI助理服务列表页,单击目标实例名称进入实例详情页,单击知识库页签,进入知识库管理界面。
生成知识库
首次使用知识库功能时,需要先进行知识库生成。
在知识库Tab的空状态页面,单击开始生成知识库。
在模式选择弹窗中,选择生成模式:
模式 | 说明 | 预计耗时 |
快速模式 | 解析元数据schema、任务代码与血缘关系,并进行LLM轻量增强(表的display_name、业务描述、业务域)。 | 约10-20分钟 |
深度模式(推荐) | 包含快速模式全部能力,额外进行数据采样与画像统计(distinct/null/值分布,辅助PII识别)以及LLM深度语义增强(表+列描述、派生指标识别、同义词与术语库聚合)。 | 小时级(随资产数量浮动) |
确认选择后,系统开始生成知识库,页面进入生成中状态,实时显示进度百分比。
生成完成后,页面自动切换到知识库浏览模式。
深度模式注意事项:深度模式会触发SQL采样查询(MaxCompute/Spark等),可能产生计算资源消耗。无权限的表将自动跳过。建议在业务低峰期使用深度模式生成知识库。
管理知识库
知识库生成完成后,支持以下操作:
浏览文件:树状目录浏览知识库文件内容。
编辑文件:修改知识库中的文件内容。仅支持编辑自定义上传的文件。
导入文件:上传自定义知识文件,补充AI助理的业务知识。支持上传的文件格式为:.md、.txt、.pdf、.docx、.xlsx、.html、.csv,且不超过10M。
导出文件:单文件直链下载或多文件打包导出。
重新生成:当DataWorks工作空间的元数据发生变化后,您可以重新生成知识库以获取最新的知识上下文。
清空知识库:清除所有已生成的知识库文件。
实例监控
在AI助理服务列表页,单击目标实例名称进入实例详情页,单击监控页签,进入实例监控界面。可查看实例的资源使用情况:
CPU使用率:已使用CPU /规格总量。
内存使用量:已使用内存/规格总量。
磁盘使用量:已使用磁盘空间/规格总量。
支持选择时间范围查看历史趋势,默认显示最近1小时的数据。
实例日志
在AI助理服务列表页,单击目标实例名称进入实例详情页,单击日志页签,进入实例监控界面。可查看实例的资源使用情况:可查询实例运行日志:
支持按子系统筛选日志来源。
支持按关键词搜索日志内容。
支持选择时间范围过滤日志。
使用AI助理服务
使用对话
通过Web端使用AI助理服务
AI助理服务实例创建成功后,在实例列表中单击对话,即可在DataWorks控制台内直接与AI助理对话。
会话管理
Web端支持普通会话和定时任务两种会话管理,左侧会话侧边栏提供以下功能:
普通会话:
新建会话:单击+ 新任务创建新的对话会话。
切换会话:单击会话列表中的会话名称切换到对应会话。
定时任务:
定时/触发式任务:DataWorks内置多种定时任务的模板,您可以选择已有模板,快速启动一个新任务。
对话交互
在对话界面中,您可以通过自然语言与AI助理交互。AI助理会自动调用DataWorks API执行运维操作,所有写操作执行前需要您的确认。
通过IM端使用AI助理服务
AI助理服务实例创建成功后,您可以在配置了机器人的群中或与机器人私聊的方式,通过自然语言与AI助理服务交互。
主动提问:在群内@机器人或与机器人私聊,输入您的问题或指令,AI助理服务将自动理解意图并执行对应操作。
场景
示例指令
任务失败诊断
诊断任务实例 12345678 失败的原因告警分析
分析当前未恢复的告警基线SLA查询
查看基线 base_test 的SLA达成情况工作流补数据
对工作流 wf-001 补数据,时间范围 2026-01-01 到 2026-01-31重跑失败任务
对今天abc工作空间中失败的调度实例执行重跑自动告警诊断:当DataWorks监控规则触发告警时,AI助理服务自动接收告警并进行AI诊断,将诊断结果推送到IM群。
告诉AI助理服务:
帮我开启自动监控告警,推送到当前会话。AI助理服务 将自动配置告警监听,并将DataWorks触发的告警信息,以消息卡片的形式发送至当前会话。后续,您只需在对话框中通过自然语言指令(如"查看失败日志"、"重跑当前节点"或"回滚至上一版本"),即可直接调用底层API执行运维动作,无需登录控制台,缩短故障修复时间。
开启治理巡检:支持开启自动巡检,AI助理服务将自动执行资产治理巡检工作,并将巡检结果定时推送到IM群。
告诉AI助理服务:开启自动巡检,推送到当前会话。
治理巡检默认每日09:30推送巡检结果至IM端,支持通过对话的方式,修改定时推送的时间和频率。同时,也可以向AI助理服务提交更明确的治理项问题,如:"开启治理巡检,间隔3个小时推送一次表负责人为主账号的表个数"以满足个性化需求。
写操作二次确认:所有写操作(如重跑、冻结、删除、修改等)在执行前,AI助理服务会明确展示操作类型、操作对象和涉及数量,必须经过您的明确确认后才会执行。
定时任务
AI助理服务内置多个任务模板,帮助您快速配置定时巡检任务。在Web端对话界面的会话侧边栏中,单击定时任务打开模板面板,选择模板即可创建对应的定时任务会话。
如需要在IM端配置定时任务,可直接使用自然语言让AI助理进行配置。
定时巡检任务模板
以下定时任务模板均默认每日09:00执行,自动生成巡检报告并推送到会话中:
任务名称 | 说明 |
SLA基线完成报告 | 诊断统计今天项目空间下基线整体完成情况,并输出报告 |
项目空间完成报告 | 诊断分析项目空间今日任务完成情况,并输出报告 |
巡检不良资产 | 统计名下治理问题,分析优先级并输出报告 |
巡检数据质量 | 统计高优表未配置数据质量监控的情况,分析并给出建议 |
每日巡检失败任务根因分析 | 汇总昨日失败实例并深度诊断Top5高频失败任务 |
每日巡检资源组水位 | 识别资源组水位、负载和排队瓶颈,给出扩容或错峰建议 |
每日巡检慢任务排行 | 对比历史运行时间,分析运行及等待耗时Top10的异常变慢情况 |
每日巡检告警规则覆盖盲区 | 查找关键基线和高优任务的告警覆盖盲区并给出补全建议 |
每日巡检补数据执行状态 | 汇总近7天补数据任务状态并分析失败原因 |
每日巡检未配置生命周期的表 | 按存储量统计未配置生命周期的表并输出Top20配置建议 |
每日巡检无主表和废弃资产 | 扫描长期未访问及无负责人的表,形成候选下线清单 |
每日巡检代码变更治理合规 | 检查最近24小时节点变更的治理规则结果并按负责人汇总 |
每日巡检存储与计算消耗排行 | 输出存储与计算消耗Top20,并分析增长趋势与优化建议 |
每日巡检资产编目覆盖率 | 统计未纳入资产类目的表和占比,并提供编目建议 |
自定义定时任务
DataWorks也支持自定义定时任务,在Web端单击定时任务,在定时任务右上角单击自定义新建,跟随AI助理的提示,填写定时任务的运行时间间隔和具体的任务内容即可。
计费说明
AI助理服务的费用包含以下部分:
收费项 | 计费方式 | 说明 |
Data Agent席位 | 按席位购买 | 使用AI助理服务的前提条件,需先开通Data Agent席位。详情请参见Data Agent 概述。 |
资源组费用 | 按量计费(按时长) | AI助理服务实例运行所消耗的资源组CU费用。若资源组需要进行网络打通,还会产生相应的网络费用: PrivateZone + 私网连接:PrivateZone(产品计费)、终端节点(私网连接计费说明)。 开通公网:NAT(NAT 网关计费)。 |
AI推理 | 按Token使用量计费 | AI助理服务调用AI模型进行智能诊断和分析的费用。详情请参见Data Agent 费用。 |
与DataWorks Agent的区别
对比项 | DataWorks Agent | AI助理服务 |
使用入口 | DataWorks控制台内(Data Studio页面) | Web端(DataWorks控制台AI助理服务页面)和IM端(钉钉、飞书、企业微信群聊) |
主要场景 | 数据开发、数据集成、数据治理等全场景 | 运维场景(告警诊断、任务管理、基线监控等)以及数据治理场景 |
交互方式 | 浏览器内DataAgent对话框 | Web端专属对话界面或IM群聊中@AI助理 |
告警集成 | 不支持 | 支持接收告警并自动AI诊断 |
知识库 | 不支持 | 支持构建工作空间级知识库(RAG) |
定时任务 | 不支持 | 支持定时巡检和触发式任务 |
自定义技能 | 不支持 | 支持导入和管理自定义Skill |
AI助理服务钉钉交流群
您需要先单击申请链接加入"阿里云大数据AI平台"组织,再扫描下方二维码加入AI助理服务产品钉钉交流群,加入后,即可获得专属产品技术支持!
