阿里云DataClaw是基于开源OpenClaw构建的企业专属数据助理。它内置了 DMS 数据管理、安全审计、数据库自治服务及元数据理解等多项核心技能,旨在通过自然语言交互,帮助您简化数据操作、提升工作效率。
功能特性
为提升数据运维与分析的效率和智能化水平,本系统深度融合自然语言交互与自动化执行能力,提供以下核心功能:
自然语言驱动:通过自然语言即可完成数据查询、变更、工单提交等日常操作。
智能分析与洞察:支持多轮对话式的数据探索与分析,并能主动进行根因定位。
自动化工作流:支持将查询、订正、验证、通知等多个步骤串联成自动化工作流,一句话即可触发。
7×24 小时无人值守:支持配置定时巡检任务,实现主动发现问题、自动告警和智能处理。
前提条件
已开通阿里云 DMS 服务。
已拥有阿里云账号并完成实名认证。
快速入门
第一步:创建 DataClaw 实例
单击立即创建,等待实例初始化完成。
说明实例初始化通常需要 1~2 分钟,请耐心等待。
第二步:配置访问凭证(可选)
DataClaw 支持通过授权访问用户的 DMS 实例与数据库。此配置为可选项,未授权时系统仍可正常使用。
单击 “凭证管理” → “添加凭证”。
添加你的AK/SK。
保存配置将触发服务重启。服务重启成功后,方可调用 DMS 相关接口或功能。
第三步:配置第三方通讯工具(推荐)
DataClaw 完成任务后会通过第三方通讯工具向您推送通知,或者直接通过工具与DataClaw进行对话。
在创建DataClaw实例弹窗中,单击渠道配置(选填)。
按需输入钉钉/飞书/企业微信/QQ机器人的ClientId(AppId)和ClientSecret(AppSecret)。
发送一条测试消息,确认群内能正常收到。
(可选)飞书机器人会返回配对码,通过让dataclaw执行改命令完成配对。


您可以同时配置多个通知渠道,DataClaw 会将通知推送到所有已配置的渠道。
第四步:安装 Skills(可选)
DataClaw 已内置核心 Skills,您也可以根据需要安装扩展 Skills。
内置 Skills(开箱即用)
Skill 名称
说明
DMS 数据管理 Skill
数据查询、变更、工单管理。
DMS 安全审计 Skill
权限控制、操作审计。
DAS 智能运维 Skill
慢 SQL 诊断、性能分析。
Meta Agent Skill
业务语义理解。
DMS Data Agent Skill
专业的数据分析智能体,从数据到洞察,释放企业数据价值
可选 Skills(按需安装)
Skill 名称
说明
DataWorks 集成 Skill
对接 DataWorks 数据开发平台。
Redis 运维 Skill
Redis 专项监控与诊断。
MongoDB 分析 Skill
MongoDB 查询优化建议。
安装方式:进入 Skills 市场,单击目标 Skill 的 安装 按钮即可。
第五步:开始使用
DataClaw 支持以下三种交互方式。
方式一:在 DMS 控制台使用
单击顶部导航栏的 DataClaw 入口,进入对话界面。
在输入框中使用自然语言描述您的需求。
方式二:通过钉钉/飞书机器人交流使用
在已配置的第三方通讯工具中进行对话,DataClaw会自动回复。
方式三:定时任务自动运行
在 DataClaw 控制台创建定时任务,到点将自动执行,并将结果推送到您的 IM 工具。
核心功能详解
自然语言提工单
适用场景
需要提交数据变更工单,但不想手动填写复杂表单。
使用方法
在对话框中直接描述您的变更需求。例如:
把 orders 表里 3 月之前 pending 的订单全部改成 cancelledDataClaw 会自动完成:
意图识别:识别目标库表、筛选条件和变更内容。
SQL 生成:生成准确的
UPDATE语句。影响预估:预估本次变更将影响的数据行数。
方案生成:自动生成回滚 SQL 方案。
工单提交:创建数据变更工单并提交至审批流。
多任务编排
您可以在一条指令中描述完整的工作流,DataClaw 会自动拆解并按序执行。例如:
把 orders 表里 3 月之前 pending 的订单改成 cancelled,改完后查一下确认没有遗漏DataClaw 会自动拆解为以下步骤:
执行 UPDATE 变更。
查询验证 pending 记录是否清零。
生成执行报告并推送通知。
智能数据查询与分析
适用场景
快速查询数据、探索性分析、生成报表。
基础查询
输入查询需求,DataClaw 会自动生成并执行 SQL,返回结果表格。例如:
查询上周各渠道的订单量和 GMVDataClaw 会自动识别时间范围,关联订单表和渠道维度表,生成并执行 SQL,返回结果表格。
多轮追问
DataClaw 支持基于上下文的多轮对话。您可以在前序查询的基础上继续追问:
只看华东区的,再按天分组看看趋势根因分析
DataClaw 支持智能根因分析,不仅展示数据变化趋势,还会自动下钻定位异常原因。例如:
最近一周 GMV 为什么下降?DataClaw 会关联取消率、退款率等指标,下钻到地区、品类维度,定位到具体异常点(如"某地区物流超时激增"),给出可操作的结论。
定时巡检与主动汇报
适用场景
替代每日手动巡检,实现异常主动通知。
配置方法
在 DataClaw 对话中描述巡检需求,例如:
每天早上 9 点,检查所有生产库的连接数、慢查询 Top10、磁盘使用率和主从延迟,生成日报推送到钉钉群DataClaw 会执行以下操作:
创建定时任务(每天 09:00 执行)。
自动巡检所有已授权的生产库。
生成结构化日报(包含异常标记和诊断建议)。
推送到已配置的钉钉/飞书群。
日报内容示例
【DataClaw 数据健康日报】2026-03-06 09:00 巡检概览 正常实例:12/14 需关注:2/14 异常详情 【prod-mysql-01】磁盘使用率 87%,建议清理 binlog 或扩容 【prod-mysql-03】慢查询新增 3 条,详见附件分析报告 诊断建议 - prod-mysql-01:binlog 已积累 180G,可清理 30 天前日志释放约 120G - prod-mysql-03:慢查询均为库存校验 SQL,建议添加复合索引 (sku_id, warehouse_id)
SQL 任务托管
适用场景
长时间运行的 SQL 任务,如大数据量变更、复杂分析查询等。
使用方法
在 SQL 窗口或 DataClaw 对话中提交任务时,选择 托管给 DataClaw。
DataClaw 会执行以下操作:
全程监控任务执行状态。
异常时自动诊断(如锁等待、连接超时)。
支持自动重试(可配置重试次数)。
完成后主动推送执行结果。
生成执行报告(包含耗时、影响行数、资源消耗等信息)。
异常处理示例
【DataClaw 任务异常通知】 任务:订单历史数据归档 状态:执行中断 原因:连接超时(超过 300s 无响应) 诊断结果 - 目标表数据量过大(约 2.3 亿行) - 建议分批执行,每批 500 万行 自动操作 DataClaw 已按建议分批重试,当前进度 34%,预计 45 分钟后完成
审批智能预审
适用场景
作为审批人快速评估变更风险。
使用方法
在工单审批页面,单击 让 DataClaw 预审。DataClaw 会自动分析以下维度:
分析维度
说明
风险等级
基于影响行数、执行时间、锁范围评估为低/中/高。
影响范围
涉及的库表、预估行数、是否跨分片等。
回滚方案
是否可回滚、回滚语句预览。
优化建议
是否有更高效的执行方式。
预审报告示例
【DataClaw 预审报告】工单 #4825 变更概要 类型:UPDATE(数据订正) 目标:orders_prod.orders 影响:预估 2,341 行 风险等级:中 原因:UPDATE 涉及主键范围较广,可能触发行锁竞争 影响分析 - 锁等待风险:中等(建议低峰期执行) - 主从延迟:预计增加 2~5s - 回滚可行性:支持(已生成回滚语句) 优化建议 当前 SQL:UPDATE orders SET status='cancelled' WHERE ... 建议改为:分批执行,每批 500 条,间隔 1s 可降低锁竞争约 80% 预审结论:
高级管理
Skills 管理
DataClaw 的能力由一系列可插拔的 Skills 提供。您可以像管理手机应用一样,对 Skills 进行安装、更新和卸载。管理入口为DataClaw 控制台 → “Skills 管理” / “Skills 市场”。
安装新 Skill
点击 「Skills 市场」
浏览或搜索需要的 Skill
点击 「安装」,阅读权限说明
确认后等待安装完成(约 10-30 秒)
更新 Skill:当 Skills 有新版本时,控制台会显示 「可更新」 标记:
点击 「查看更新日志」 了解新版本改进
点击 「更新」 完成升级
卸载 Skill
在 「Skills 管理」 页面找到要卸载的 Skill
点击 「卸载」
确认后该 Skill 相关功能将不再可用
安全与合规
权限控制:DataClaw 严格遵循 DMS 的权限体系,所有操作都不会超越您为 DataClaw 配置的账号权限。权限规则如下:
权限级别
说明
适用场景
只读
仅可执行 SELECT 查询
数据分析、报表生成
读写
可执行 DML(INSERT/UPDATE/DELETE)
数据订正、批量更新
变更
可提交 DDL/DML 工单
结构变更、数据变更
管理
可管理其他用户权限
团队管理员
敏感数据保护:自动继承 DMS 的敏感数据脱敏规则,在查询结果和 AI 模型交互中对敏感字段进行脱敏处理。敏感列脱敏规则如下:
手机号、身份证号、银行卡号等敏感字段自动脱敏显示
AI 模型调用时不传输敏感数据明文
审计日志中敏感字段显示为 ***
操作审计:所有通过 DataClaw 发起的操作(包括自然语言指令和生成的 SQL)都会被详细记录,可在 DMS 的 “安全审计” → “DataClaw 操作日志” 中查看。记录规则如下:
操作人(谁发起的指令)
操作时间
执行内容(自然语言指令 + 生成的 SQL)
影响范围(库表、行数)
执行结果(成功/失败)
高危变更拦截:内置高危操作识别规则(如
DELETE不带WHERE、DROP TABLE等),在执行前会进行风险提示并要求二次确认,且会自动通知管理员。DataClaw 内置高危操作识别规则:DELETE 不带 WHERE 条件
UPDATE 影响行数超过 10 万
DROP TABLE/DATABASE
跨分片大批量更新
常见问题
Q:DataClaw 会存储我的业务数据吗?
A:不会。DataClaw 采用以下数据安全机制:
数据查询结果仅在本地内存处理,不落盘存储。
AI 模型调用仅传输必要的指令上下文(如表结构、字段名),不传输业务数据。
业务数据不会上传到云端模型。
Q:DataClaw 生成的 SQL 安全吗?
A:DataClaw 生成的 SQL 会经过多层安全校验:
语法校验:确保 SQL 语法正确可执行。
规则校验:检查是否违反安全规则(如高危操作拦截)。
影响预估:预估影响行数,异常时自动预警。
人工确认:最终执行前需您确认或审批。
Q:是否支持同时在多个群使用 DataClaw?
A:支持。DataClaw 支持多渠道同时配置:
可同时接入多个钉钉群和飞书群。
不同群可配置不同的通知策略。
所有渠道共享同一个 DataClaw 实例的能力。
Q:操作报错,提示没有权限。
A:用户缺少AliyunDMSDataClawFullAccess权限,可通过以下步骤进行权限的添加:
Q:DataClaw 支持哪些数据库?
A:DataClaw 支持 DMS 已接入的所有数据源类型,详情请参考DMS支持的数据库。
说明具体支持的数据库版本以您的 DMS 实例配置为准。