OSS Agent是阿里云对象存储OSS提供的智能体(Agent)服务,支持通过自然语言完成Bucket管理、异常诊断、健康巡检、费用分析,以及对Bucket中视频、图片、文档等多模态数据的语义检索与直接对话能力。
当前OSS Agent开放邀测,请联系技术支持申请开通。
功能概述
OSS Agent基于通义大模型构建,能够理解自然语言意图,自动规划并执行多步骤API调用链,在工作区可视化呈现执行过程与结果。OSS Agent提供以下两类核心能力:
智能运维:通过自然语言完成Bucket配置、访问异常诊断、健康巡检、费用分析等运维操作。适用于需要快速完成多步骤配置、排查访问异常或定期评估Bucket健康状况等场景。
Talk to Bucket:基于OSS Metaquery 的内容感知能力,对Bucket中的视频、图片、音频、文档等多模态数据发起自然语言检索与对话,无需记录文件路径或构造查询语句。适用于需要从海量非结构化数据中按内容语义定位目标文件的场景,如安防监控溯源、媒资素材检索、企业文档查找等。
所有操作按风险等级分级管控:低危读操作直接执行;中危写操作需您二次确认后执行;高危操作(删除、生命周期等)暂不支持由 Agent 直接执行,将提供控制台或 API/SDK 操作流程供您执行参考。
前提条件
已开通OSS服务。
如使用RAM用户访问OSS Agent,需确保该用户具备目标Bucket的相关操作权限。
使用OSS Agent
登录OSS管理控制台,进入OSS Agent对话页面。
首次访问时,阅读并确认使用须知后进入对话界面。
在首页底部的输入框输入您的需求或在首页选择智能运维专家、快问快答小助手或对话多模态数据卡片上的问题快速开始。
OSS Agent界面由以下三个区域组成:
左侧栏:提供新建会话、Region与Bucket 选择框、历史会话列表和技能管理入口。
中间对话区:输入需求与OSS Agent交互。输入框支持使用
@临时引用Bucket,指定该 Bucket 进行操作。右侧工作区:作为Agent与控制台之间的协同联动区域,并提供常用内置工具(创建Bucket、资源包推荐、错误码诊断等)。
智能运维
多步骤操作编排
对于需要多步配置的操作,OSS Agent将自然语言指令自动拆解为有序的API调用链,每步执行结果实时显示。涉及费用或风险的步骤会在执行前主动提示。
示例:帮我在上海地域创建一个名为 sample-bucket 的Bucket,开启服务端加密和版本控制,并配置只允许内网访问的权限策略。
Agent执行链:① 在上海地域创建 Bucket → ② 开启服务端加密(AES256)→ ③ 开启版本控制
(Enabled)→ ④ 配置 Bucket Policy 限制仅允许内网(VPC)访问。
对于参数敏感的操作(如创建Bucket),Agent会将推荐的参数传递给控制台原生表单并在工作区展示供您审查和修改,确认后再执行。
访问异常诊断
将无法访问的Object链接或报错信息发给OSS Agent,Agent自动发起多步诊断,输出根因定位结果,并给出可操作的修复建议。
示例:这个图片访问不了,帮我看看为什么?https://examplebucket.oss-cn-hangzhou.aliyuncs.com/exampleobject?x-oss-additional-headers=host&x-oss-credential=LTAI********************%2F20241203%2Fcn-hangzhou%2Foss%2Faliyun_v4_request&x-oss-date=20241203T034420Z&x-oss-expires=3600&x-oss-signature=70c542eaf652ac291c0c343d63ac24ede41c0526661d9d4c63c0906a**********&x-oss-signature-version=OSS4-HMAC-SHA256
Agent定位根因(例如"该URL为OSS V4预签名临时访问链接,有效期3600秒,当前已超过签名过期时间"),并给出修复步骤。
Bucket健康检查
对指定Bucket发起健康检查,Agent自动检测安全、数据保护、成本管理和基础信息四大维度,输出每项状态及说明,对存在风险的项给出优化建议。确认后,Agent可逐项执行修复操作。
示例:帮我的Bucket @samplebucketname 做一次健康检查。
Agent 将自动执行多个 API 调用,覆盖四大健康检查维度。
维度 | 检查项 |
安全检查 | Bucket ACL、服务端加密、阻止公共访问、防盗链、CORS |
数据保护 | 版本控制、删除标记、Multipart Upload 碎片清理 |
成本管理 | 生命周期规则、访问日志、访问监控 |
基础信息 | Bucket 概览(地域、存储类型、冗余策略、对象数量、存储用量) |
费用分析
Agent自动拉取账单数据,按存储费用、流量费用、请求费用等计费项逐项分析,输出结构化费用报告,帮助您了解各Bucket的实际费用构成。
示例:帮我做费用分析。
Agent 将自动拉取账单数据,逐项分析存储、流量、请求等计费项,输出结构化的费用报告。
Talk to Bucket
工作原理
OSS Agent的Talk to Bucket能力基于OSS Metaquery 数据索引(AI内容感知 + 向量检索),采用以下三层架构处理语义检索:
内容感知层:通过多模态大模型对视频、图片、音频、文档进行内容理解,生成语义描述与结构化标签。
向量索引层:将内容解析结果转化为高维向量,构建向量索引。
语义匹配层:将用户自然语言转化为Query Embedding,在向量数据库中进行多路检索与精排,返回Top-K匹配结果。
整个处理过程对用户无感,OSS Agent会引导完成从开通MetaQuery数据索引到存量数据向量化、再到可自然语言对话与检索的全流程。
开通数据索引
在页面底部输入框左下角的悬浮面板中,点击Talk to Bucket开关开启会话,开启后,发送的消息会自动触发多模态数据检索 Skill,对选定的 Bucket 进行智能检索与问答。使用Talk to Bucket功能,OSS Agent会自动检测目标Bucket的MetaQuery数据索引功能开通状态,并在需要时引导对目标Bucket开通MetaQuery数据索引。
开通MetaQuery数据索引后会产生AI内容感知和语义向量检索相关费用,OSS Agent在执行开通操作前会主动提示费用说明,请确认后再执行。关于MetaQuery计费详情,请参见数据索引费用。
存量数据需要一定时间完成向量化处理,处理完成前无法执行检索。OSS Agent会在处理期间提示当前索引状态,请等待处理完成后再发起检索。
典型应用场景
图片语义检索
适用于媒资素材库等场景。通过描述图片内容进行检索,不依赖人工标签或文件命名规则。
示例:@指定Bucket 帮我找出火山喷发的图片 。
Agent返回匹配图片,每张附带:文件路径、大小、分辨率、标签、描述。
直接对话多模态数据
适用于安防监控、视频档案等场景。通过描述事件内容在海量视频切片中定位目标片段,无需逐段回放。
示例:帮我看下是谁放的火造成火灾?如果找到视频请发给我。
Agent返回匹配视频,附带:视频路径、时长、AI生成的场景描述、对象检测结果,以及可直接下载的预签名链接(有效期15分钟,过期后需重新生成)。
AI内容感知的识别结果仅供参考,准确性受视频清晰度等因素影响,不可替代人工研判。
文档语义检索
适用于企业知识库、技术文档管理等场景。Agent读取文档内容,基于语义匹配返回相关文档及可访问链接,而非依赖文档名称或路径。
示例:帮我找出跟某互联网平台项目有关的文档。
配额与限制
项目 | 说明 |
并发的会话数 | 单个UID单个设备同时活跃会话数为 2。 |
会话生命周期 | 空闲超过1小时或累计对话超过8小时,会话自动中止。 |
高危操作限制 | 删除类操作(Bucket、Object、配置删除)、生命周期、WORM、数据复制、覆盖写、静态网站托管等高危操作暂不支持直接执行,OSS Agent提供控制台跳转链接。 |
计费说明
OSS Agent当前处于免费邀测阶段,但通过OSS Agent触发的OSS产品操作(如开通MetaQuery数据索引、数据访问等)按OSS对应计费项收费,Agent在执行前会主动提醒,详细计费见计费概述。