容器服务 Agent 是阿里云的 AI 原生容器智能管理平台,提供覆盖集群与应用全生命周期的 7×24 小时自主智能运维能力,能够有效提升系统整体稳定性,为企业业务的持续稳定运行保驾护航。
功能介绍
Agent 任务
通过任务功能页面发起一次任务会话(Session),支持通过自然语言提交运维任务,Agent会自动进行意图识别并规划完成相关的集群管理运维任务。
任务页面可查看历史会话并继续对话。
全生命周期运维管理
容器服务 Agent 旨在降低 ACK 集群与 Kubernetes 资源对象的使用与运维门槛,在以下阶段提供智能协助:
Day-0(设计规划)阶段:提供云原生容器化的规划与设计帮助,例如推荐集群、节点等资源的配置。
Day-1(资源与应用创建)阶段:辅助设计与撰写应用配置文件,例如 Terraform、Kubernetes YAML 等。
Day-2(运维)阶段:提供智能运维领域的问题快速诊断,以及成本、资源使用策略、高可用、稳定性、安全等方面的方案优化推荐。
AI 辅助的智能可观测
容器服务 Agent 将大语言模型能力与 ACK 的容器场景可观测最佳实践深度融合,您可以通过自然语言交互查询和分析集群可观测数据,将问题排查从「数据检索」提升至「智能洞察」。
Prometheus:支持 ACK 集群对应的阿里云 Prometheus、自建 Prometheus 的指标查询,以及自然语言转 PromQL。
集群控制面日志查询:支持 ACK 集群控制面 SLS(Simple Log Service,日志服务)日志的查询,包括 SLS SQL 查询和自然语言转 SLS SQL。
审计日志:Kubernetes 操作审计追踪。
智能诊断与健康体检
在 ACK 控制台查看节点、Pod、Workload 的异常状态、错误信息、事件等信息时,单击智能诊断按钮即可唤起容器服务 Agent 快速诊断异常。
容器服务 Agent 会结合集群中节点、应用的可观测数据综合分析并输出智能诊断结论,通常会解释异常原因并尝试给出解决方案。若无法定位根因,您可以进一步对异常 Pod、Node 发起基于 ACK 技术专家诊断经验的深度故障诊断。更多信息,请参见使用集群诊断。
自主智能运维
自主智能运维能够实时感知集群异常,并自动触发 Agent 进行深度根因分析与修复方案推演。在获得用户授权确认后,系统将自动执行修复操作,实现从问题发现到闭环处置的智能化全流程管理。
具体请参考容器服务 Agent 自主智能运维功能。
Routine 定时任务
容器服务Agent提供定时任务功能,支持灵活配置定时触发或周期性循环的智能任务。该功能能够驱动 Agent 按照既定策略自动执行日常维护工作,全面实现运维任务的无人值守与全生命周期自动化管理。
具体请参考容器服务 Agent定时任务功能。
使用说明
授权
容器服务 Agent 基本功能需授权,请参见授权使用容器服务Agent功能。
容器服务 Agent 自主智能运维功能需额外授权,请参见自主智能运维功能开通与授权。
使用须知
本服务输出内容由大语言模型生成,受限于当前人工智能技术的局限性,无法保证生成内容的完整性与准确性。请您审慎评估并独立判断生成内容,切勿将其作为唯一依据或过度依赖。因您基于生成内容作出的任何决策或行为而产生的后果及损失,由您自行承担。
请确保您输入的信息合法合规,不损害社会公共秩序,不侵犯他人合法权益,不编造或传播虚假信息等,您的使用行为由您自行负责。
本服务运行过程中会访问您账户下的资源(如 ECS 实例、ACK 集群等)及相关资源的配置、状态及可观测性数据用于集群管理,不会收集您的业务数据。
计费说明
当前功能处于预览(Preview)阶段,免费使用。
产品正式发布(GA)后的商业收费计划将另行公布。