Data Agent for Analytics

更新时间:
复制为 MD 格式

Data Agent for Analytics是阿里云瑶池数据库团队推出的面向企业用户的数据分析智能体,可以根据自然语言描述进行需求分析,自动完成数据理解,并基于数据理解提出分析需求,扩展分析思路,最终通过调用工具交付分析结果可以到阿里云官网体验馆免费体验

应用场景

  • 业务人员:负责定义数据需求,以快速生成销售趋势、用户行为分析等报告。

  • 数据分析师:进行探索性分析,代理完成自动化特征工程和数据清洗等耗时任务,并复用Python代码。

  • 管理者:迅速获取关键业务指标的深度洞察与分析,以数据化手段支持业务决策。

功能特性

  • 自动化探索数据洞察:通过自然语言描述需求,Agent自主完成对需求的理解、数据的理解、数据分析的洞察及报告的生成。

  • 缩短数据价值路径:无需关注复杂的数据处理流程,重点关注数据结果与业务决策之间的关系。

  • 无缝连接企业数据:支持阿里云瑶池数据库及DMS托管的数据源,能够即刻实现数据分析。

扩展集成

  • 核心组件:Data Agent Skill

  • 一键集成:支持从Git 仓库直接拉取安装或通过复制以下命令快速部署,一键装载智能体。

    npx skills add https://github.com/aliyun/data-agent-skill
  • 功能简介:该技能包支持灵活下载并无缝集成至您的智能体服务中。旨在构建与企业数据源之间的安全桥梁,通过标准化的连接协议,显著增强智能体的数据访问能力与分析洞察深度,助力企业快速构建定制化数据智能应用。

功能限制

当前仅华东1(杭州)、华东2(上海)、华南1(深圳)、西南1(成都)、华北2(北京)、华北3(张家口)、中国香港、新加坡地域支持。

布局介绍

  • 初始界面:

    image

    • 数据中心:分析数据新增和上传。

    • 任务管理:分析任务的历史记录。

    • 用户信息:当前登录账号信息。

    • 交互区域:新的分析任务中与Agent首次进行沟通以及分析任务执行的展示区域。

  • 工作界面:

    • 交互区域:分析任务开始后的交互区域。

    • 任务执行区域:可查看Agent为分析任务编写的每个步骤代码以及执行结果。

账号准备

第一步:创建使用账号

在阿里云创建用于使用 Data Agent 的账号。根据业务需要,创建对应的 RAM 用户。

第二步:为账号授权

为账号授予 Data Agent 功能的使用权限。权限策略名称:AliyunDMSDataAgentFullAccess

说明

该权限仅对应 Data Agent 功能的使用权限,不涉及数据权限。数据权限需要在使用过程中按需申请和审批。

授权方式:

  • 方式一:为单个账号授权

    1. 使用具有 RAM 管理员权限的阿里云账号访问 RAM 用户列表

    2. 搜索需要授权的 RAM 用户,单击其操作列的新增授权

    3. 在弹出页面中,搜索并选中 AliyunDMSDataAgentFullAccess 权限策略,单击确认新增授权

  • 方式二:用户组统一授权

    1. 使用具有 RAM 管理员权限的阿里云账号访问 RAM 用户组列表

    2. 选择目标用户组,在用户组详情页的权限管理页签中单击新增授权

    3. 搜索并选中 AliyunDMSDataAgentFullAccess 权限策略,单击确认新增授权

    4. 将想要授权的用户加入该用户组。

  • 方式三:通过身份对接免登录使用

    如果您希望将 Data Agent 集成到企业内部系统中,免登录阿里云直接使用,可以通过账号体系对接实现。具体操作,请参见Data Agent 控制台免登录集成指南

操作步骤

  1. 登录Agent控制台

  2. 请根据业务需求选择合适的版本,各版本之间的差异详见Data Agent版本介绍

    image

    • 免费版:

      免费版卡片中,单击免费试用

    • 个人版:

      • 个人版卡片中,单击升级至个人版

      • 根据实际需求,选择地域、使用席位和使用时长。

        说明

        使用时长中单击月度时长,可以选择对应时长。

        image

      • 单击立即购买,并完成后续购买操作。

    • 企业版:

      • 企业版卡片中,单击升级至企业版

      • 根据实际需求,选择地域、大模型资源包数量和使用时长。

        说明

        使用时长中单击月度时长,可以选择1~11个月。

        image

      • 单击立即购买,并完成后续购买操作。

  3. 上传数据样本,支持通过本地上传和已有数据上传。

    image

    • 单击image,进行本地上传,支持上传不大于200Mcsv、xlsx、xls格式文件。

    • 单击image,选择已有数据上传,已有数据可通过数据中心添加。

  4. 进行需求描述,按回车键或单击image,开始分析。

    image

  5. 等待Agent生成执行计划,确认执行计划是否满足需求。

    image.png

    • 若满足需求,单击开始任务

    • 若不满足,单击修改任务,进一步补充需求描述,直到分析计划满足需求为止。

      image.png

  6. 等待计划执行,执行过程中可以查看每个步骤Agent为分析认为编写的代码及执行结果。

  7. 可以让Agent根据数据情况自行绘制可视化的网页报告,进行更丰富的数据洞察呈现。

    image

数据中心

在左侧导航栏中,单击数据中心,然后在页面中单击添加数据按钮,根据所选数据源类型,选择相应的数据接入方式。

image

  • 本地上传

    将需要分析的文件拖至上传区域或单击上传区域进行文件上传,上传完成后单击确认

  • 云数据库:免费版和个人版支持RDS数据库PolarDB数据库AnalyticDB数据库,企业版支持40种+数据源,具体列表详见DMS支持的数据库

    image

    1. 选择地域实例

    2. 输入数据库用户名数据库密码

    3. 单击测试链接以继续

    4. 选择表所属库添加表

    5. 单击确认

  • DMS托管实例

    您可以将已录入至DMS中的MaxComputeHologres实例作为数据源接入,对其数据进行分析。具体的录入流程,请参见录入实例

添加数据常见问题

添加 MaxCompute 实例后不显示库和表

2024 年后新购的 MaxCompute 实例需要使用租户级 Information_schema 处理,且需要升级架构到 Schema 层级。操作步骤如下:

  1. 在 MaxCompute 控制台的项目管理页面,执行升级到支持Schema层级操作。

  2. 为 DMS 录入实例时使用的 AccessKey 对应的用户身份授予租户管理的 admin 权限。

  3. 在 DMS 实例管理中,单击目标实例右侧的编辑,然后单击保存以触发实例识别 Schema 层级变更。

添加 Hologres 实例报错无法连通

DMS 访问 Hologres 实例需要确保对应的 Hologres 实例有指定 VPC 地址。

关于 VPC 地址配置,请参见 Hologres 实例配置

下拉列表中搜不到库或表

单击刷新按钮,如果表数量不大,通常 30 秒内重新搜索即可找到。

刷新库表提示 permission denied

操作用户需要具备对应云数据库资源的 RAM 权限,或在 DMS 中拥有管理员或 DBA 角色权限。

  • 方式一:RAM 权限策略授权

    为用户授予对应云产品的 RAM 权限策略。常用的系统策略如下:

    引擎类型

    Action

    Resource ARN

    系统策略

    RDS

    dms:LoginDatabase

    acs:rds:{region}:{accountId}:dbinstance/{instanceId}

    AliyunRDSFullAccess

    PolarDB

    dms:LoginDatabase

    acs:polardb:{region}:{accountId}:*/{instanceId}

    AliyunPolardbFullAccess

    AnalyticDB MySQL

    adb:*

    acs:adb:{region}:{accountId}:dbcluster/{instanceId}

    AliyunADBFullAccess

    AnalyticDB PostgreSQL

    gpdb:*

    acs:gpdb:{region}:{accountId}:dbinstance/{instanceId}

    AliyunGPDBFullAccess

  • 方式二:为用户授予DMS 管理员或 DBA 角色

    在 DMS 中为用户授予管理员或 DBA 角色。具体操作,请参见管理用户

长期记忆

长期记忆是Agent的一项核心能力。当您与Agent进行对话分析时,系统会自动捕捉并提炼对话中对未来数据分析有价值的关键信息,并将其沉淀为Agent的长期记忆。这些记忆将在您后续的交互中被智能召回和应用,从而显著提升Agent对您业务需求的理解准确性,优化分析效果,并改善整体使用体验。

功能配置

该功能默认开启,以确保持续优化您的分析体验。如果您不希望系统自动沉淀任何记忆,可以通过以下路径关闭:

列表说明

记忆管理页面,您可以查看并管理所有已沉淀的记忆。列表包含以下关键信息:

列表项

说明

来源

标记了该条记忆产生的具体对话。您可以点击快捷链接,直接跳转到原始对话上下文,方便追溯记忆的来源。

内容

展示了系统从对话中提取并理解的关键信息。

热度

系统会根据每条记忆被召回和使用的频次,通过算法计算出一个“热度值”。热度值越高,代表该条记忆在您的分析工作中越常用、越重要。

状态

记忆存在两种状态:
• 已记住:此状态下的记忆是激活的,会在后续的分析过程中被召回使用。
• 已遗忘:此状态下的记忆是失效的,不会再被召回。

操作

在操作列您可以对记忆进行编辑和删除操作:

  • 编辑:当您发现系统沉淀的记忆内容不够准确、完整,或业务定义发生变更时,点击对应记忆条目后的编辑图标。在弹出的编辑框中,手动修正或完善记忆内容,然后保存。这能确保Agent学习到最正确的信息。

  • 删除:当您认为某条记忆已过时、无效,或不应再被用于分析时,点击对应记忆条目后的删除图标。此操作是双重状态的:

    • 对于已记住的记忆:点击后,该记忆的状态将变为已遗忘,但记录本身依然保留在列表中,您可以选择将其重新记住。

    • 对于已遗忘的记忆:点击后,该记忆记录将从列表中被永久移除,无法恢复。

数据隐私声明

  • Agent不会使用您的个人数据,包括上传的文件、查询内容、分析结果以及生成的报告,进行模型训练或模型迭代。

  • 您的数据将在个人账号下按需启动的独占计算实例中进行处理,实例释放后将被销毁;其他账号无法通过任何途径获取您账号下使用的数据、过程及历史记录。

  • 基于本地上传的数据,上传的原始文件存储在独立环境中,与其他账号实现隔离,互不可见。

  • 基于数据库的分析,本次数据存储于个人采购的数据库中。在计算过程中,不会进行数据的迁移。数据计算完成后,所有中间结果将被销毁,不会进行存储。