DataClaw 快速入门

更新时间:
复制为 MD 格式

阿里云DataClaw是基于开源OpenClaw构建的企业专属数据助理。它内置了 DMS 数据管理、安全审计、数据库自治服务及元数据理解等多项核心技能,旨在通过自然语言交互,帮助您简化数据操作、提升工作效率。

功能特性

为提升数据运维与分析的效率和智能化水平,本系统深度融合自然语言交互与自动化执行能力,提供以下核心功能:

  • 自然语言驱动:通过自然语言即可完成数据查询、变更、工单提交等日常操作。

  • 智能分析与洞察:支持多轮对话式的数据探索与分析,并能主动进行根因定位。

  • 自动化工作流:支持将查询、订正、验证、通知等多个步骤串联成自动化工作流,一句话即可触发。

  • 7×24 小时无人值守:支持配置定时巡检任务,实现主动发现问题、自动告警和智能处理。

前提条件

  • 已开通阿里云 DMS 服务。

  • 已拥有阿里云账号并完成实名认证。

快速入门

第一步:创建 DataClaw 实例

  1. 登录阿里云 DATA+AI Studio

  2. 单击立即创建,等待实例初始化完成。

    说明

    实例初始化通常需要 1~2 分钟,请耐心等待。

第二步:配置访问凭证(可选)

DataClaw 支持通过授权访问用户的 DMS 实例与数据库。此配置为可选项,未授权时系统仍可正常使用。

  1. 单击 “凭证管理” → “添加凭证”。

  2. 添加你的AK/SK。

  3. 保存配置将触发服务重启。服务重启成功后,方可调用 DMS 相关接口或功能。

第三步:配置第三方通讯工具(推荐)

DataClaw 完成任务后会通过第三方通讯工具向您推送通知,或者直接通过工具与DataClaw进行对话。

  1. 创建DataClaw实例弹窗中,单击渠道配置(选填)

  2. 按需输入钉钉/飞书/企业微信/QQ机器人的ClientId(AppId)和ClientSecret(AppSecret)。

    • 钉钉应用及机器人创建方式请参考:钉钉应用创建

    • 飞书应用创建方式请参考:飞书应用创建

    • QQ机器人创建方式请参考:QQ机器人创建

    • 企业微信机器人创建方式:访问企业微信管理后台,在左侧导航栏单击管理工具 > 智能机器人。单击创建机器人,单击手动创建,选择API模式创建。连接方式选择“使用长连接”,“点击获取”Secret,记录下Bot IDSecret,点击保存即可。

  3. 发送一条测试消息,确认群内能正常收到。

  4. (可选)飞书机器人会返回配对码,通过让dataclaw执行改命令完成配对。

    image.png

    image.png

说明

您可以同时配置多个通知渠道,DataClaw 会将通知推送到所有已配置的渠道。

第四步:安装 Skills(可选)

DataClaw 已内置核心 Skills,您也可以根据需要安装扩展 Skills。

  • 内置 Skills(开箱即用)

    Skill 名称

    说明

    DMS 数据管理 Skill

    数据查询、变更、工单管理。

    DMS 安全审计 Skill

    权限控制、操作审计。

    DAS 智能运维 Skill

    慢 SQL 诊断、性能分析。

    Meta Agent Skill

    业务语义理解。

    DMS Data Agent Skill

    专业的数据分析智能体,从数据到洞察,释放企业数据价值

  • 可选 Skills(按需安装)

    Skill 名称

    说明

    DataWorks 集成 Skill

    对接 DataWorks 数据开发平台。

    Redis 运维 Skill

    Redis 专项监控与诊断。

    MongoDB 分析 Skill

    MongoDB 查询优化建议。

    安装方式:进入 Skills 市场,单击目标 Skill 的 安装 按钮即可。

第五步:开始使用

DataClaw 支持以下三种交互方式。

  • 方式一:在 DMS 控制台使用

    1. 单击顶部导航栏的 DataClaw 入口,进入对话界面。

    2. 在输入框中使用自然语言描述您的需求。

  • 方式二:通过钉钉/飞书机器人交流使用

    在已配置的第三方通讯工具中进行对话,DataClaw会自动回复。

  • 方式三:定时任务自动运行

    在 DataClaw 控制台创建定时任务,到点将自动执行,并将结果推送到您的 IM 工具。

核心功能详解

自然语言提工单

  • 适用场景

    需要提交数据变更工单,但不想手动填写复杂表单。

  • 使用方法

    在对话框中直接描述您的变更需求。例如:

    把 orders 表里 3 月之前 pending 的订单全部改成 cancelled

    DataClaw 会自动完成:

    1. 意图识别:识别目标库表、筛选条件和变更内容。

    2. SQL 生成:生成准确的 UPDATE 语句。

    3. 影响预估:预估本次变更将影响的数据行数。

    4. 方案生成:自动生成回滚 SQL 方案。

    5. 工单提交:创建数据变更工单并提交至审批流。

  • 多任务编排

    您可以在一条指令中描述完整的工作流,DataClaw 会自动拆解并按序执行。例如:

    把 orders 表里 3 月之前 pending 的订单改成 cancelled,改完后查一下确认没有遗漏

    DataClaw 会自动拆解为以下步骤:

    1. 执行 UPDATE 变更。

    2. 查询验证 pending 记录是否清零。

    3. 生成执行报告并推送通知。

智能数据查询与分析

  • 适用场景

    快速查询数据、探索性分析、生成报表。

  • 基础查询

    输入查询需求,DataClaw 会自动生成并执行 SQL,返回结果表格。例如:

    查询上周各渠道的订单量和 GMV

    DataClaw 会自动识别时间范围,关联订单表和渠道维度表,生成并执行 SQL,返回结果表格。

  • 多轮追问

    DataClaw 支持基于上下文的多轮对话。您可以在前序查询的基础上继续追问:

    只看华东区的,再按天分组看看趋势
  • 根因分析

    DataClaw 支持智能根因分析,不仅展示数据变化趋势,还会自动下钻定位异常原因。例如:

    最近一周 GMV 为什么下降?

    DataClaw 会关联取消率、退款率等指标,下钻到地区、品类维度,定位到具体异常点(如"某地区物流超时激增"),给出可操作的结论。

定时巡检与主动汇报

  • 适用场景

    替代每日手动巡检,实现异常主动通知。

  • 配置方法

    DataClaw 对话中描述巡检需求,例如:

    每天早上 9 点,检查所有生产库的连接数、慢查询 Top10、磁盘使用率和主从延迟,生成日报推送到钉钉群

    DataClaw 会执行以下操作:

    1. 创建定时任务(每天 09:00 执行)。

    2. 自动巡检所有已授权的生产库。

    3. 生成结构化日报(包含异常标记和诊断建议)。

    4. 推送到已配置的钉钉/飞书群。

  • 日报内容示例

    【DataClaw 数据健康日报】2026-03-06 09:00
    
    巡检概览
      正常实例:12/14
      需关注:2/14
    
    异常详情
      【prod-mysql-01】磁盘使用率 87%,建议清理 binlog 或扩容
      【prod-mysql-03】慢查询新增 3 条,详见附件分析报告
    
    诊断建议
      - prod-mysql-01:binlog 已积累 180G,可清理 30 天前日志释放约 120G
      - prod-mysql-03:慢查询均为库存校验 SQL,建议添加复合索引 (sku_id, warehouse_id)

SQL 任务托管

  • 适用场景

    长时间运行的 SQL 任务,如大数据量变更、复杂分析查询等。

  • 使用方法

    在 SQL 窗口或 DataClaw 对话中提交任务时,选择 托管给 DataClaw

    DataClaw 会执行以下操作:

    1. 全程监控任务执行状态。

    2. 异常时自动诊断(如锁等待、连接超时)。

    3. 支持自动重试(可配置重试次数)。

    4. 完成后主动推送执行结果。

    5. 生成执行报告(包含耗时、影响行数、资源消耗等信息)。

  • 异常处理示例

    【DataClaw 任务异常通知】
    
    任务:订单历史数据归档
    状态:执行中断
    原因:连接超时(超过 300s 无响应)
    
    诊断结果
      - 目标表数据量过大(约 2.3 亿行)
      - 建议分批执行,每批 500 万行
    
    自动操作
      DataClaw 已按建议分批重试,当前进度 34%,预计 45 分钟后完成

审批智能预审

  • 适用场景

    作为审批人快速评估变更风险。

  • 使用方法

    在工单审批页面,单击 让 DataClaw 预审DataClaw 会自动分析以下维度:

    分析维度

    说明

    风险等级

    基于影响行数、执行时间、锁范围评估为低/中/高。

    影响范围

    涉及的库表、预估行数、是否跨分片等。

    回滚方案

    是否可回滚、回滚语句预览。

    优化建议

    是否有更高效的执行方式。

  • 预审报告示例

    【DataClaw 预审报告】工单 #4825
    
    变更概要
      类型:UPDATE(数据订正)
      目标:orders_prod.orders
      影响:预估 2,341 行
    
    风险等级:中
      原因:UPDATE 涉及主键范围较广,可能触发行锁竞争
    
    影响分析
      - 锁等待风险:中等(建议低峰期执行)
      - 主从延迟:预计增加 2~5s
      - 回滚可行性:支持(已生成回滚语句)
    
    优化建议
      当前 SQL:UPDATE orders SET status='cancelled' WHERE ...
      建议改为:分批执行,每批 500 条,间隔 1s
      可降低锁竞争约 80%
    
    预审结论:

高级管理

Skills 管理

DataClaw 的能力由一系列可插拔的 Skills 提供。您可以像管理手机应用一样,对 Skills 进行安装、更新和卸载。管理入口为DataClaw 控制台 → “Skills 管理” / “Skills 市场”。

  • 安装新 Skill

    • 点击 「Skills 市场」

    • 浏览或搜索需要的 Skill

    • 点击 「安装」,阅读权限说明

    • 确认后等待安装完成(约 10-30 秒)

  • 更新 Skill:当 Skills 有新版本时,控制台会显示 「可更新」 标记:

    • 点击 「查看更新日志」 了解新版本改进

    • 点击 「更新」 完成升级

  • 卸载 Skill

    1. 在 「Skills 管理」 页面找到要卸载的 Skill

    2. 点击 「卸载」

    3. 确认后该 Skill 相关功能将不再可用

安全与合规

  • 权限控制:DataClaw 严格遵循 DMS 的权限体系,所有操作都不会超越您为 DataClaw 配置的账号权限。权限规则如下:

    权限级别

    说明

    适用场景

    只读

    仅可执行 SELECT 查询

    数据分析、报表生成

    读写

    可执行 DML(INSERT/UPDATE/DELETE)

    数据订正、批量更新

    变更

    可提交 DDL/DML 工单

    结构变更、数据变更

    管理

    可管理其他用户权限

    团队管理员

  • 敏感数据保护:自动继承 DMS 的敏感数据脱敏规则,在查询结果和 AI 模型交互中对敏感字段进行脱敏处理。敏感列脱敏规则如下:

    • 手机号、身份证号、银行卡号等敏感字段自动脱敏显示

    • AI 模型调用时不传输敏感数据明文

    • 审计日志中敏感字段显示为 ***

  • 操作审计:所有通过 DataClaw 发起的操作(包括自然语言指令和生成的 SQL)都会被详细记录,可在 DMS 的 “安全审计” → “DataClaw 操作日志” 中查看。记录规则如下:

    • 操作人(谁发起的指令)

    • 操作时间

    • 执行内容(自然语言指令 + 生成的 SQL)

    • 影响范围(库表、行数)

    • 执行结果(成功/失败)

  • 高危变更拦截:内置高危操作识别规则(如 DELETE 不带 WHEREDROP TABLE 等),在执行前会进行风险提示并要求二次确认,且会自动通知管理员。DataClaw 内置高危操作识别规则:

    • DELETE 不带 WHERE 条件

    • UPDATE 影响行数超过 10 万

    • DROP TABLE/DATABASE

    • 跨分片大批量更新


常见问题

  • Q:DataClaw 会存储我的业务数据吗?

    A:不会。DataClaw 采用以下数据安全机制:

    • 数据查询结果仅在本地内存处理,不落盘存储。

    • AI 模型调用仅传输必要的指令上下文(如表结构、字段名),不传输业务数据。

    • 业务数据不会上传到云端模型。

  • Q:DataClaw 生成的 SQL 安全吗?

    A:DataClaw 生成的 SQL 会经过多层安全校验:

    1. 语法校验:确保 SQL 语法正确可执行。

    2. 规则校验:检查是否违反安全规则(如高危操作拦截)。

    3. 影响预估:预估影响行数,异常时自动预警。

    4. 人工确认:最终执行前需您确认或审批。

  • Q:是否支持同时在多个群使用 DataClaw

    A:支持。DataClaw 支持多渠道同时配置:

    • 可同时接入多个钉钉群和飞书群。

    • 不同群可配置不同的通知策略。

    • 所有渠道共享同一个 DataClaw 实例的能力。

  • Q:操作报错,提示没有权限。

    A:用户缺少AliyunDMSDataClawFullAccess权限,可通过以下步骤进行权限的添加:

    1. 使用具有RAM管理员的阿里云账号访问RAM用户列表

    2. 搜索需要授权的RAM用户,单击其右侧的添加权限

    3. 搜索并选中AliyunDMSDataClawFullAccess权限策略,单击确认新增授权

  • Q:DataClaw 支持哪些数据库?

    A:DataClaw 支持 DMS 已接入的所有数据源类型,详情请参考DMS支持的数据库

    说明

    具体支持的数据库版本以您的 DMS 实例配置为准。