RDS AI助手

RDS AI助手是阿里云RDS产品推出的智能运维辅助工具,其基于大语言模型与专家知识库,集成智能问答、性能诊断、个性化Agent与安全控制四大能力。支持自然语言交互,提供根因分析、优化建议与跨实例资源洞察,助力高效问题排查与规模化管理。内置RAM权限继承与操作确认机制,确保智能化与安全性兼顾,显著降低RDS MySQL的使用门槛与运维复杂度。

重要
  • RDS AI助手当前仅对白名单用户开放,如需使用,请通过阿里云主账号提交表单提交工单申请使用。

  • 目前仅支持华东1(杭州)、华东2(上海)、华北2(北京)、华南1(深圳)地域。

RDS AI助手简介

核心能力

智能问答

基于自然语言输入,查询多实例元数据与性能指标,实现资源批量检索与问题诊断。

image

智能诊断

在慢日志、错误日志等页面集成AI问答入口,实现上下文关联的即时诊断与解读。

image

个性化Agent定制

支持自定义AI助手的角色、知识库与响应逻辑,适配不同场景下的运维管理需求。

image

安全与权限控制

继承RAM权限体系,确保只读访问与操作分离,变更操作需手动确认,保障数据与操作安全。

image

产品优势

  • 开箱即用:无需搭建Agent平台或调优模型,控制台直接启用,能力持续迭代,避免技术栈过时。

  • 运维提效:支持秒级自动诊断,90%以上场景实现“诊断先行、人工后审”,巡检、告警响应、文档查询等重复任务可由Agent自动化执行。

  • 全域资源:统一聚合全量实例的配置、性能、成本与安全状态,支撑容量规划与资源优化决策。

  • 安全合规: 操作全程可追溯,集成RAM权限控制与交互确认机制,满足金融、政务等高合规要求。

产品架构

image

费用说明

RDS AI助手当前处于免费公测阶段,您可直接使用全部功能。

注意事项

为确保您安全、高效地使用RDS AI助手,请注意以下操作建议:

  • 操作安全:所有涉及实例变更的操作(如重启、降配等)均不会自动执行,系统提供可执行建议,需在控制台手动确认后方可生效,保障操作可控。

  • 提问精准:提问时请尽量包含具体实例ID、明确的时间范围及问题诉求,例如rm-bp1****在昨日10:00~11:00CPU升高原因,有助于提升诊断精准度。

  • 上下文慎用:系统支持多轮对话上下文理解,建议您基于AI返回的初步建议,进一步提出具体问题以获取更详细的执行方案。但若您在处理敏感任务,请谨慎进行连续追问,防止上下文信息误用。

  • 决策审慎:生成的优化建议基于当前监控数据与模型推理得出,建议您在执行关键变更前,结合业务运行状态进行综合评估与验证。

RDS AI助手访问入口

RAM子账号访问时需确保已具备AliyunRDSAIFullAccess或更高权限。授权方法,请参见RAM授权访问RDS实例

说明

若已授予AliyunRDSFullAccess(权限范围包含AI相关接口),则无需额外授权。

方式一:访问RDS实例列表,在上方选择地域,单击页面右上方image图标。

image

方式二:访问RDS实例详情页,单击页面右上方image图标。

image

1. 智能问答

RDS AI助手支持通过自然语言提问,自动分析数据库性能问题或批量检索多个实例的元数据与运行指标,实现问题定位与资源治理的高效交互。

适用场景

  • 全域资源查询:快速获取指定地域或标签下多个实例的配置、性能指标与元数据,支持跨实例批量信息检索。

  • 性能根因分析:针对响应延迟、负载升高等问题,自动关联分析SQL执行、参数配置与系统资源,定位潜在瓶颈。

  • 异常实例筛查:主动识别处于锁定、磁盘超限、连接数异常等风险状态的实例,提升巡检效率。

  • 合规与治理检查:批量验证安全策略(如删除保护、SSL加密)是否在生产环境全面启用,辅助完成配置审计。

  • 产品与技术咨询:通过自然语言问答获取RDS功能说明、MySQL版本特性、最佳实践建议等技术支持信息,降低使用门槛。

运行方式

当您输入如为什么数据库变慢?北京地域RDS MySQL实例的平均连接数是多少?等问题时,系统将按以下流程处理:

  1. 智能解读:识别问题中的关键信息,包括目标实例(或筛选条件)、关注指标(如CPU、SQL性能)、时间范围及意图类型(诊断或查询)。

  2. 数据联动

    • 性能诊断类问题:自动关联目标实例的慢SQL、负载趋势、参数配置、锁等待等上下文数据;

    • 批量查询类问题:基于地域、标签、引擎等条件匹配实例集合,再并行采集所需字段。

  3. 智能分析:结合规则引擎与统计模型,进行根因推断或跨实例聚合计算,生成诊断结论或汇总结果。

  4. 结果输出:返回结构化建议或明细列表,如优化SQL语句、推荐参数调整值、异常实例清单等,均附简要说明,便于理解与执行。

快速上手

查询类场景:

发起提问。示例:请查询北京地域快要过期的RDS实例。

支持的查询维度

类别

支持字段示例

实例属性

实例ID、引擎、版本、规格、核数、内存、状态、存储类型、创建时间、VpcId、VSwitchId、连接地址

计费与成本

计费类型、到期时间

配置安全

删除保护

监控指标

查询范围涉及多个实例时,目前仅支持CPU使用率、IOPS使用率、磁盘使用率和会话连接数的批量查看。但在此基础上,您可对单个实例进一步查询其他详细监控指标

常见提问方式(仅供参考)

  • 资源水位评估(容量规划)

    • 请查询本账户在北京地域内未来30天内即将到期的包年包月RDS MySQL实例。

    • 请查询上海地域RDS MySQL实例当前的最高CPU使用率。

    • 请统计杭州地域当前RDS MySQL实例的整体负载情况,重点关注连接数超过80%阈值的实例。

  • 配置合规审计(安全治理)

    请列出北京地域所有未开启删除保护的生产环境RDS MySQL实例。

  • 异常实例筛查(运维巡检)

    • 请找出当前磁盘使用率超过90%的所有RDS MySQL实例,并显示其实例ID和所属项目标签。

    • 请筛选出IOPS持续高于80%的RDS MySQL实例,并按IO使用率从高到低排序。

北京实例过期(重录)

分析类场景:

发起提问,推荐以实例ID+问题场景+发生时间的形式提问。示例:请分析实例rm-bp1qr4******近6小时内CPU使用率情况。

常见提问方式(仅供参考)

  • CPU使用率高

    • 请分析实例rm-bp1qr4******在最近6小时内CPU使用率持续偏高的原因。

    • 实例rm-bp1qr4******的CPU使用率在昨日14:00~16:00达到90%以上,请排查可能的SQL或配置原因。

    • 请检查实例rm-bp1qr4******最近一天是否存在因慢SQL导致的CPU负载升高。

  • 磁盘使用率高/空间增长快

    • 请分析实例rm-bp1qr4******最近24小时内磁盘使用率快速上升的原因。

    • 实例rm-bp1qr4******的存储空间在近3天内增长了15GB,请定位主要空间占用来源。

    • 请排查实例rm-bp1qr4******当前磁盘使用率达85%是否由binlog或临时文件引起。

  • SQL执行变慢

    • 请分析实例rm-bp1qr4******中SQL IDabc123xyz的语句在昨日为何执行时间显著变长。

    • 实例rm-bp1qr4******的某条查询从100ms变为2s,请检查是否存在执行计划变更或锁等待。

    • 请诊断实例rm-bp1qr4******最近出现的慢SQL是否因缺少索引导致全表扫描。

  • 连接数异常/连接过多

    • 请分析实例rm-bp1qr4******在今天上午10:00连接数突增至800的原因。

    • 实例rm-bp1qr4******的当前连接数接近上限,请排查是否存在连接泄漏或应用未释放连接。

    • 请检查实例rm-bp1qr4******最近是否存在因连接风暴导致的性能下降。

  • 数据库整体变慢/业务延迟

    • 请分析实例rm-bp1qr4******在过去1小时内整体响应变慢的可能根因。

    • 实例rm-bp1qr4******的QPS下降、RT上升,请综合负载、SQL和参数情况给出诊断。

    • 业务反馈访问延迟高,请结合实例rm-bp1qr4******的性能指标分析数据库是否为瓶颈。

  • IO使用率高/IO等待严重

    • 请分析实例rm-bp1qr4******在昨晚是否存在IO等待导致的性能问题。

    • 实例rm-bp1qr4******的IO使用率持续高于90%,请排查是否由大查询或批量写入引起。

    • 请检查实例rm-bp1qr4******最近是否存在因大表DDL操作导致IO负载升高。

  • 参数配置不合理(可结合诊断)

    • 请分析实例rm-bp1qr4******的当前参数配置是否存在影响性能的配置项。

    • 实例rm-bp1qr4******出现频繁swap,请检查innodb_buffer_pool_size是否设置过小。

    • 请评估实例rm-bp1qr4******的max_connections配置是否合理,并给出建议值。

CPU使用率分析(重录)

2. 智能诊断

RDS AI助手已深度集成至RDS控制台核心运维页面,面向实例异常分析、日志分析、参数配置等场景提供基于自然语言的智能交互能力。在无需离开当前操作界面的前提下,支持通过一键操作实时获取对慢SQL、错误日志、性能异常、参数设置等问题的专业分析结果。系统自动关联实例上下文,结合监控数据与产品知识库生成结构化诊断建议,支持导出与进一步交互。

适用场景

  • 日志诊断:不理解某条错误日志的含义及其对业务的影响。

  • 参数诊断:参数设置不合理导致性能下降,需获得调整建议。

  • 异常诊断:高可用状态异常,需确认主备切换是否完成或存在风险。

运行方式

  1. 自然语言输入:用户通过口语化指令提出问题,例如这条错误日志是什么意思?

  2. 智能解析与上下文关联:RDS AI助手自动理解问题背景,关联相关数据库实例、日志数据及性能指标。

  3. 专项诊断与知识整合:根据问题类型调用相应的分析模块(如日志分析引擎、SQL诊断器、HA状态检查等),并结合产品知识库生成解答。

  4. 多模态结果输出:答案以结构化报告、可视化图表或可操作建议的形式呈现,支持进一步交互查询。

快速上手

支持的场景

控制台入口

控制台界面

实例异常分析

访问RDS实例列表,单击页面上方RDS Copilot实例异常分析,单击智能推荐列下的具体事件。支持的异常事件如下:

  • CPU使用率分析

  • 磁盘空间使用率分析

  • MySQL内核Crash分析

  • 主备故障切换分析

  • 慢查询分析

image

慢日志分析

访问RDS实例详情页,进入日志管理页面,在慢日志明细页签下,将鼠标移动至SQL语句处,单击image

image

错误日志分析

访问RDS实例详情页,进入日志管理页面,在错误日志页签下:

  • 方式一:将鼠标移动至日志内容处,单击image

  • 方式二:单击image,鼠标自定义选中错误日志内容,单击image

image

image

参数设置解析

访问RDS实例详情页,进入参数设置页面,在可修改参数页签下:

  • 查看参数详情:将鼠标移动至image处,单击image进行更多上下文交互。

  • 参数修改建议:将鼠标移动至image处,单击image进行更多上下文交互。

image

image

主备切换日志分析

访问RDS实例详情页,进入服务可用性页面,在主备切换日志区域,单击image

image

3. 个性化Agent定制

RDS AI助手支持用户基于实际运维需求,创建具有特定角色、知识背景和权限范围的自定义AI助手(Agent)。通过配置角色定义、提示词逻辑、关联工具及输出规范,实现对数据库管理任务的个性化建模,建议遵循最小权限原则分配能力,确保安全可控。

适用场景

  • 企业标准:将企业内部术语、命名规范、审批流程等上下文注入AI助手,确保输出符合组织标准。

  • 定制角色:为不同岗位(如DBA、开发、安全)配置具备对应职责边界的助手,防止越权建议。

  • 统一输出:统一输出格式,适配“汇报型”“简洁型”或“审计型”等团队沟通风格。

  • 例行巡检:固化高频巡检任务,如每日生成慢SQL报告、每周执行配置合规检查等,减少重复操作。

运行方式

  1. 定义角色与场景:设置Agent的身份目标,例如“生产环境SQL审核专员”或“成本优化分析员”,明确其服务边界。

  2. 配置提示词与知识库:输入定制化指令(Prompt),可包含企业SOP、判断规则或参考文档片段,指导Agent在特定场景下的响应逻辑。

  3. 绑定工具与权限:配置可调用的数据库操作、API工具及相应权限,明确Agent能力边界。

  4. 测试与部署:在仿真环境中验证Agent的响应准确性与行为合规性,确认无误后保存为正式助手,随后通过自然语言随时调用即可。

快速上手

  1. 单击image创建专属Agent。

  2. 输入专属Agent名称,单击确认创建

image

  1. 配置并调试Agent。

    1. 在左侧配置提示词,并选择合适工具,以便AI助手根据您的配置进行回答。

    2. 在右侧输入提问方式,单击发送测试效果,多次调试直至符合预期为止。

    3. 调试完成后,单击页面右上角完成保存即可。

      示例:自定义配置专属Agent“实例每日巡检”。

image

  1. 实际业务调用专属Agent。

    1. 访问RDS AI助手对话框

    2. 单击左下角image,勾选目标Agent和目标实例。

    3. 发起提问,单击image即可。

image

4. 安全与权限控制

RDS AI助手在提供智能便捷服务的同时,全面保障数据库资产的安全性与合规性。通过继承阿里云RAM(资源访问管理)体系的精细权限控制,确保RDS AI助手所有行为均在用户授权范围内进行,杜绝越权操作风险,为AI辅助数据库管理提供可靠的安全底座。

适用场景

  • 权限风控:运维人员发起实例变更操作时,必须手动授权操作,同时仅允许有权限账号执行。

  • 安全审计:禁止低权限角色通过AI助手发起高风险操作指令。

运行方式

  • 权限继承机制:RDS AI助手自动继承当前用户的RAM权限,仅可访问和操作用户已有权管理的实例及数据。

  • 查询类操作:信息检索、诊断分析等只读操作可直接执行,结果实时返回。

  • 变更类操作:任何涉及配置修改、数据变更或高风险操作(如重启、删除)的指令,均会触发明确的安全确认流程,由用户手动审核并最终授权执行,RDS AI助手不会自动执行任何修改。

快速上手

发起提问,单击确定授权AI助手执行变更。

示例:请将当前实例的名称修改为二次安全确认测试。

二次安全确认(重录)

更多操作

更多操作

控制台入口

控制台界面

查看历史对话

  • 访问RDS实例列表,在上方选择地域,单击页面右上方image图标。

  • 单击页面右上角image图标。

image

导出对话详情

  • 访问RDS实例列表,在上方选择地域,单击页面右上方image图标。

  • 单击image(下载为图片)或image(复制内容)图标。

image

常见问题

  • Q1:RDS AI助手是否会自动执行数据库变更操作?

    A1:不会。RDS AI助手不会自动执行任何配置修改或数据变更操作。所有涉及变更的建议仅作为参考方案输出,必须由用户在控制台手动确认后方可实施。

  • Q2:RDS AI助手支持哪些数据库引擎?

    A2:RDS AI助手的能力按引擎和版本有所差异。目前RDS MySQL 5.6/5.7/8.0完整支持智能问答、智能诊断、个性化Agent和安全控制四大功能模块。对于RDS SQL Server、PostgreSQLMariaDB,仅支持智能问答中的元数据与实例信息查询功能,暂不支持性能诊断、根因分析及Agent定制等高级运维能力。

  • Q3:AI元数据查询最多可覆盖多少个实例?

    A3:该功能适用于大规模实例管理,默认可查询指定地域内当前账号权限范围内的全部RDS实例,具体数量受实例分布与权限策略影响,无固定上限。

  • Q4:是否支持接入企业内部知识库或运维规范?

    A4:支持。通过个性化Agent定制功能,您可在提示词中引入企业SOP、合规要求或内部命名规范,使AI助手输出更贴合组织标准。

  • Q5:如何提高AI助手的查询或诊断准确率?

    A5:建议提问时明确包含实例ID、时间范围及具体现象(如CPU偏高或连接数突增),并利用上下文连续追问。信息越完整,分析结果越精准。