DAS Agent

更新时间:
复制为 MD 格式

DAS Agent是基于大模型技术,融合了阿里云10万+工单和专家经验的智能数据库运维大脑,专注于解决云数据库的日常运维及稳定性问题。通过融合AI,构建了覆盖问题发现、诊断、优化的全链路自治能力,为您提供高效、精准的数据库稳定性保障。

前提条件

目标数据库已正常接入DAS。

说明

当前已支持主流的数据库,

MySQL:RDS MySQLPolarDB MySQL、其他云厂商的MySQL、本地自建MySQL;

PostgreSQL:RDS PostgreSQLPolarDB PostgreSQL、其他云厂商的PostgreSQL、本地自建PostgreSQL;

Redis:云数据库Tair(兼容redis)、其他云厂商的Redis、本地自建Redis;

MongoDB:云数据库MongoDB、其他云厂商的MongoDB、本地自建MongoDB;

SQL Server:RDS SQL Server

分布式数据库:PolarDB-X

注意事项

  • 若您需要通过RAM用户(子账号)使用DAS Agent功能,则须确保该RAM用户具备DAS的管理权限和数据库实例的管理权限。

  • 若您需要将DAS Agent的智能运维能力集成至非DAS控制台或其他业务系统中,请提交工单以进行咨询。

  • 受各国及地区数据安全法规限制,不同国家或地区的数据库实例无法由同一个大模型服务统一管理。因此,若您的实例分布在多个地域,需按国家或地区分别开通 DAS Agent。如中国内地(北京、上海、杭州、广州等)可共用一个中国区 DAS Agent,而美国、新加坡、印尼等地的实例则需在各自国家或地区独立开通。

  • 海外 DAS Agent 依赖百炼大模型,目前仅在新加坡和美国部署,因此模型调用将就近路由至这两个区域。待百炼在更多国家/地区开服后,DAS Agent 将自动迁移至本地百炼服务。

    注:以上仅涉及百炼模型的跨国调用,数据库审计日志等数据始终保留在实例所在国家/地区的 Region 内,请放心使用。

费用信息

详情可参见DAS Agent资费详情

功能说明

功能

状态

说明

数据库知识问答

支持

知识库从通用数据库知识,扩展至由阿里云资深行业专家多年积累和整理的内部文档,覆盖主要的OLTPNoSQL引擎类型,包含异常处理建议、升降配建议、变更影响分析等多种知识类型。

数据库异常诊断

支持

覆盖在线事务处理(OLTP)及NoSQL的多种场景,包括指标与异常查询、实时诊断(CPU、内存、会话)、锁分析、时延洞察(Tair)、大Key分析(Tair)、慢SQL分析(OLTPMongoDB)、SQL优化(涵盖已运行的SQL及尚未运行的SQL的预检优化功能)、数据库安全风险检测等。由DAS Agent进行智能分析,以识别根本原因并提供优化及止血建议

说明

在当前阶段,建议仍需人工采纳,尚未开通大模型自动执行的功能。

智能运维报告

支持

账号下多个实例(支持跨引擎)的统一运维报告,包含指标趋势对比分析、优化建议及监控建议等内容。

说明

当前仅支持日报功能,未来将扩展至周报和月报,并将提供用户自定义报告模板的功能。

异常检测与预警

未支持

将基于性能趋势监控指标实现和预告异常发现。

异常诊断的场景

场景

说明

支持的数据库实例

诊断所需参数

SQL诊断优化

对在指定数据库中执行的SQL语句进行分析,然后提出潜在的性能问题和优化建议。

  • RDS MySQL

  • PolarDB MySQL

  • 实例ID

  • 数据库

  • SQL脚本

CPU实时诊断(MySQL类)

通过实时获取相关数据,以诊断导致CPU使用率异常的原因。

  • RDS MySQL

  • PolarDB MySQL

  • 实例ID

  • 节点ID

    说明

    PolarDB MySQL实例必选,默认为主节点。

CPU实时诊断(Tair/Redis)

云数据库Tair(兼容redis)实例进行实时CPU使用异常诊断,根据实时采集的会话数据、大Key和热Key进行根因分析。

云数据库Tair(兼容redis)

  • 实例ID

  • 节点ID

    说明

    非必选参数。

异常会话识别

实时查询MySQL数据库实例的information_schema.processlistinformation_schema.innodb_trx,以分析异常会话。

  • RDS MySQL

  • PolarDB MySQL

  • 实例ID

  • 节点ID

    说明

    PolarDB MySQL实例必选,默认为主节点。

慢日志分析(TP)

基于SQL慢日志的统计数据,识别多种问题SQL,并提供相应的优化建议。

  • RDS MySQL

  • RDS SQL Server

  • RDS PostgreSQL

  • PolarDB MySQL

  • PolarDB PostgreSQL

  • PolarDB-X

  • 实例ID

  • 节点ID

    说明

    PolarDB MySQL实例必选,默认为主节点。

  • 时间范围(start_timeend_time

  • 需要查询的记录数(前N条记录)

安全异常事件

查询当前阿里云账号下各数据库实例中的异常行为安全事件(例如账号破解尝试、敏感数据下载、异常登录、短时间内大量删除数据、撞库攻击),帮助您快速识别潜在的安全威胁;分析异常行为的上下文,并采取针对性的防护措施,从而提高数据库的安全性和合规性。

  • RDS MySQL

  • RDS PostgreSQL

  • PolarDB MySQL

  • PolarDB PostgreSQL

  • PolarDB-X

待优化实例概览

查询当前阿里云账号下需重点关注的数据库实例列表,包括存在数据库负载变化、CPU突增、IO突增、IOPS高、实例内存突增及慢日志数量异常等现象的实例。

  • RDS MySQL

  • RDS SQL Server

  • RDS PostgreSQL

  • PolarDB MySQL

  • PolarDB PostgreSQL

  • PolarDB-X

  • 云数据库Tair(兼容redis)

  • 云数据库MongoDB

时间范围(start_timeend_time

实例信息查询

查询当前阿里云账号下的数据库实例信息,包括但不限于数据库引擎类型、引擎版本、实例ID、实例别名、实例所在地域及实例状态等。可按数据库引擎类型或关键字进行过滤。

  • RDS MySQL

  • RDS SQL Server

  • RDS PostgreSQL

  • PolarDB MySQL

  • PolarDB PostgreSQL

  • PolarDB-X

  • 云数据库Tair(兼容redis)

  • 云数据库MongoDB

  • 其他云厂商或本地自建的MySQL、SQL ServerPostgreSQL、MongoDBRedis实例。

  • 引擎类型

  • 关键字

说明

均为非必选参数。

HA查询分析

查询并分析RDS MySQL实例的主备切换记录,输出简洁的报告。

RDS MySQL

  • 实例ID

  • 时间范围(start_timeend_time

错误日志分析

对数据库实例错误日志的死锁、WarningError级别的日志进行分析,返回详细的死锁信息及错误日志产生的原因。

重要
  • 实例需开启innodb_deadlock_detectinnodb_print_all_deadlocks参数。

  • RDS MySQL实例需同时将log_error_verbosity的参数值设置为3

  • RDS MySQL

  • PolarDB MySQL

  • 实例ID

  • 节点ID

    说明

    PolarDB MySQL实例必选,默认为主节点。

  • 时间范围(start_timeend_time

实例配置查询

查询数据库实例的配置及状态信息,包括日志设置、存储策略(热/冷存储)、审计功能、性能洞察开关以及迁移和版本支持等元数据。

  • RDS MySQL

  • RDS SQL Server

  • RDS PostgreSQL

  • PolarDB MySQL

  • PolarDB PostgreSQL

  • PolarDB-X

  • 云数据库Tair(兼容redis)

  • 云数据库MongoDB

实例ID

CPU使用率诊断(MySQL类)

通过获取数据库实例指定时段的会话、慢日志、SQL洞察等相关数据,以诊断导致CPU使用率异常的原因。

  • RDS MySQL

  • PolarDB MySQL

  • 实例ID

  • 节点ID

    说明

    PolarDB MySQL实例必选,默认为主节点。

  • 时间范围(start_timeend_time

最近死锁分析

分析执行SHOW ENGINE INNODB STATUS命令所返回信息中的最新死锁日志。

  • RDS MySQL

  • PolarDB MySQL

  • 实例ID

  • 节点ID

    说明

    PolarDB MySQL实例必选,默认为主节点。

内存异常诊断(MySQL类)

分析数据库实例的内存使用率是否存在异常情况。若发现异常,则进一步分析造成内存使用率异常的原因;若未发现异常,则提示可能存在的内存异常风险。

  • RDS MySQL

  • PolarDB MySQL

  • 实例ID

  • 节点ID

    说明

    PolarDB MySQL实例必选,默认为主节点。

内存异常识别(MySQL类)

分析数据库实例的内存使用率是否存在异常情况。若发现异常或长期处于高水位,则提示内存使用率异常或处于较高水位的常见原因。

  • RDS MySQL

  • PolarDB MySQL

  • 实例ID

  • 节点ID

    说明

    PolarDB MySQL实例必选,默认为主节点。

慢日志分析(MongoDB)

基于MongoDB慢日志的统计数据,识别出多种问题Query模板,并向用户推荐需重点关注的QueryId列表,提供相应的处理建议。

云数据库MongoDB

  • 实例ID

  • 节点ID

    说明

    非必选参数。

  • 时间范围(start_timeend_time

  • 需要查询的记录数(前N条记录)

监控指标查询

查询数据库实例的CPU使用率、内存使用率、存储空间使用率等指标。

  • RDS MySQL

  • RDS PostgreSQL

  • PolarDB MySQL

  • PolarDB PostgreSQL

  • 实例ID

  • 节点ID

    说明

    PolarDB MySQL实例必选,默认为主节点。

时延洞察解读(Tair/Redis)

基于云数据库Tair(兼容redis)实例时延洞察的数据,分析Porxy节点或数据节点的时延数据,并识别出时延较高的命令或节点。

云数据库Tair(兼容redis)

  • 实例ID

  • 节点ID

    说明

    必填参数。

  • 时间范围(start_timeend_time

    说明

    分析时间最长支持30分钟。

Large Key查询分析

基于云数据库Tair(兼容redis)实例历史大Key进行分析,返回对应的热Key信息。

云数据库Tair(兼容redis)

  • 实例ID

  • 节点ID

    说明

    非必选参数。

  • 时间范围(start_timeend_time

安全基线变化

用于查询数据库实例在指定时间范围内的安全基线变化趋势。帮助您掌握当前实例的安全配置的演进过程,识别风险改善、恶化或长期未修复项置状态,并提供可落地的修复指引,从而提升数据库的安全性和合规性。

  • RDS MySQL

  • PolarDB MySQL

  • PolarDB-X

  • 实例ID

  • 时间范围(start_timeend_time

最新安全基线

用于查询当前阿里云账号下各数据库实例的最新安全基线巡检结果。帮助您全面了解数据库的安全配置状态,识别潜在风险,并提供切实可行的修复指引,从而提升数据库的安全性与合规性。

  • RDS MySQL

  • PolarDB MySQL

  • PolarDB-X

敏感数据发现

用于查询当前阿里云账号下各数据库实例中的敏感数据扫描结果,并提供数据分类与分级的详细信息。帮助您了解数据库实例中是否存在敏感数据、敏感数据的分布情况及其风险级别,从而支持数据安全管理及合规性检查。

  • RDS MySQL

  • RDS PostgreSQL

  • PolarDB MySQL

  • PolarDB PostgreSQL

  • PolarDB-X

实例拓扑查询

查询数据库实例拓扑信息和各个节点的详细信息。

  • RDS MySQL

  • RDS SQL Server

  • RDS PostgreSQL

  • PolarDB MySQL

  • PolarDB PostgreSQL

  • PolarDB-X

  • 云数据库Tair(兼容redis)

  • 云数据库MongoDB

实例ID

操作步骤

  1. 进入DAS Agent页面。

    PC

    1. 登录DAS控制台

    2. 单击DAS Agent图标。

      image

    3. DAS Agent对话框中,点击image立即开通按钮,进入DAS Agent开通页面。

      image

    4. 选择合适的实例规格并完成购买。具体规格配置及计费详情,请参考DAS Agent

      image

    移动Web

    访问并登录DAS Agent页面

    说明

    移动Web端仅支持通过网页访问DAS Agent,暂不支持在应用程序内进行访问。

  2. 配置DAS Agent。

    订单支付成功之后,您需要配置 DAS Agent 来实现对不同实例组的管理。根据不同的版本,DAS 提供了差异化的纳管能力:

    • 基础版(原个人版):仅支持一个 Agent 管理最多 10 个实例。

    • 企业版:允许配置多个 Agent 来分别管理不同的实例组。此外,还支持同一个实例被多个 Agent 同时管理,这类似于多名 DBA 轮班负责同一组实例的场景。

    配置步骤:

    1. 登录Agent 管理页

      • (可选)点击列表页上的新增按钮,您可以为企业版创建多个 Agent 并指定它们各自管理的实例清单。

    2. 编辑 Agent 配置。

      • 在目标 Agent 的操作列中点击编辑按钮,进入编辑配置页面。

      • 关联实例部分,勾选您希望该 Agent 管理的实例 ID,然后点击确定完成配置。

    3. 功能限制。

      • 完成配置后,每个 Agent 只能对其所管理的实例执行提问、诊断和交互等操作。

    场景示例:

    1. API 对接自有的系统

      如果您通过 API 将 DAS Agent 集成到自有系统中,可以根据不同的 Agent ID 进行对接。这样,不同人员(如 DBA 或研发人员)只能访问和操作其权限范围内的实例。

    2. 控制台对话使用

      当直接在控制台上操作时,用户需要切换至相应国家(地区)的相应Agent,运维其所纳管的实例。

      image

  3. 权限配置。

    为保障系统的安全性和操作的合规性,在使用 DAS Agent 前,需为对应账号配置适当的访问权限。DAS 提供两个系统内置的权限策略,适用于不同角色和使用场景:

    策略名称

    权限级别

    主要能力

    AliyunHDMReadOnlyAccess

    只读权限

    • 可在 DAS 控制台查看当前账号权限范围内的所有实例

    • 不可执行任何变更类操作(如重启、参数修改等)

    • 可对有权限的实例使用 DAS Agent 的智能诊断、性能分析、自然语言交互等运维能力

    AliyunHDMFullAccess

    全部操作权限

    • 拥有 DAS 所有功能的完全控制权

    • 可对当前 UID 下的所有数据库实例进行诊断、优化、变更、导出等操作

    • 包含 AliyunHDMReadOnlyAccess 的全部能力

    配置方式:

    1. 登录RAM 控制台

    2. 在左侧导航栏选择身份管理 > 用户

    3. 找到目标用户,在操作栏,点击添加权限按钮。

    4. 权限策略列表中搜索并选择 AliyunHDMReadOnlyAccess 或 AliyunHDMFullAccess

    5. 点击确认新增授权按钮,完成权限绑定。image

  4. 使用DAS Agent功能,发起AI诊断。

    通过诊断卡片发起诊断

    1. 根据实际需求,单击对应场景的卡片。

      image

    2. 根据实际情况,在弹出的对话框选择需要诊断的对象(实例ID)、诊断的时间范围等。

      说明

      不同场景需要配置的参数不同,请以实际页面为准。例如,进行SQL诊断优化时,需要填写SQL语句所对应的数据库和待分析的SQL语句。

    3. 单击确定

    通过自主对话发起诊断

    在对话框中输入问题后,DAS Agent 会自动识别您的意图,匹配最相关的知识并启动智能诊断。依托 Agentic 诊断能力,Agent 能根据您的提问自主规划诊断路径,并结合执行反馈动态调整后续步骤。例如,当您希望评估某个实例的健康状况时,它会从 CPU 使用率、会话数、内存占用、TPS、QPS、死锁及慢 SQL 等多个维度进行综合分析;若发现慢 SQL 问题突出,还会进一步开展 SQL 优化诊断,提供索引建议或语句改写方案。

    image

    您也可通过快捷键 /、@ 或 # 快速唤起诊断场景、拉取实例清单或选择时间范围。

    image

  5. 智能运维日报功能由DAS Agent提供,面向企业版纳管的全部数据库实例,每日基于不低于2亿token的智能分析处理规模,对异常告警明细、重点优化建议(含高价值慢SQL识别)、磁盘空间使用态势、无效索引检测结果及关键资源水位(CPU、内存、I/O等)等核心运维指标进行深度洞察与结构化汇总,生成统一、专业、可行动的运维全景视图,助力运维团队全面掌握数据库健康状态,实现风险前置预警与精准优化治理,为系统稳定性保障与持续性能提升提供坚实的数据支撑与决策依据。

    1. DAS控制台的左侧导航栏,选择工具箱 > 数据库运维日报

    2. 查找目标诊断日报。

    3. 在目标诊断日报的操作列,单击查看详情

    也可在DAS Agent页面顶部,点击image图标,查看日报信息。

    image

视频简介

移动Web端:

PC端: