容器服务Agent功能介绍

更新时间:
复制 MD 格式

容器服务 Agent 是阿里云的 AI 原生容器智能管理平台,提供覆盖集群与应用全生命周期的 7×24 小时自主智能运维能力,能够有效提升系统整体稳定性,为企业业务的持续稳定运行保驾护航。

功能介绍

Agent 任务

通过任务功能页面发起一次任务会话(Session),支持通过自然语言提交运维任务,Agent会自动进行意图识别并规划完成相关的集群管理运维任务。

任务页面可查看历史会话并继续对话。

全生命周期运维管理

容器服务 Agent 旨在降低 ACK 集群与 Kubernetes 资源对象的使用与运维门槛,在以下阶段提供智能协助:

  • Day-0(设计规划)阶段:提供云原生容器化的规划与设计帮助,例如推荐集群、节点等资源的配置。

  • Day-1(资源与应用创建)阶段:辅助设计与撰写应用配置文件,例如 Terraform、Kubernetes YAML 等。

  • Day-2(运维)阶段:提供智能运维领域的问题快速诊断,以及成本、资源使用策略、高可用、稳定性、安全等方面的方案优化推荐。

AI 辅助的智能可观测

容器服务 Agent 将大语言模型能力与 ACK 的容器场景可观测最佳实践深度融合,您可以通过自然语言交互查询和分析集群可观测数据,将问题排查从「数据检索」提升至「智能洞察」。

  • Prometheus:支持 ACK 集群对应的阿里云 Prometheus、自建 Prometheus 的指标查询,以及自然语言转 PromQL。

  • 集群控制面日志查询:支持 ACK 集群控制面 SLS(Simple Log Service,日志服务)日志的查询,包括 SLS SQL 查询和自然语言转 SLS SQL。

  • 审计日志:Kubernetes 操作审计追踪。

智能诊断与健康体检

在 ACK 控制台查看节点、Pod、Workload 的异常状态、错误信息、事件等信息时,单击智能诊断按钮即可唤起容器服务 Agent 快速诊断异常。

容器服务 Agent 会结合集群中节点、应用的可观测数据综合分析并输出智能诊断结论,通常会解释异常原因并尝试给出解决方案。若无法定位根因,您可以进一步对异常 Pod、Node 发起基于 ACK 技术专家诊断经验的深度故障诊断。更多信息,请参见使用集群诊断

自主智能运维

自主智能运维能够实时感知集群异常,并自动触发 Agent 进行深度根因分析与修复方案推演。在获得用户授权确认后,系统将自动执行修复操作,实现从问题发现到闭环处置的智能化全流程管理。

具体请参考容器服务 Agent 自主智能运维功能

Routine 定时任务

容器服务Agent提供定时任务功能,支持灵活配置定时触发或周期性循环的智能任务。该功能能够驱动 Agent 按照既定策略自动执行日常维护工作,全面实现运维任务的无人值守与全生命周期自动化管理。

具体请参考容器服务 Agent定时任务功能

使用说明

授权

使用须知

  1. 本服务输出内容由大语言模型生成,受限于当前人工智能技术的局限性,无法保证生成内容的完整性与准确性。请您审慎评估并独立判断生成内容,切勿将其作为唯一依据或过度依赖。因您基于生成内容作出的任何决策或行为而产生的后果及损失,由您自行承担。

  2. 请确保您输入的信息合法合规,不损害社会公共秩序,不侵犯他人合法权益,不编造或传播虚假信息等,您的使用行为由您自行负责。

  3. 本服务运行过程中会访问您账户下的资源(如 ECS 实例、ACK 集群等)及相关资源的配置、状态及可观测性数据用于集群管理,不会收集您的业务数据。

计费说明

当前功能处于预览(Preview)阶段,免费使用。

产品正式发布(GA)后的商业收费计划将另行公布。