Alibaba Cloud Linux 4 Agentic Edition,别名Agentic OS ,是阿里云一款 Agent-first 操作系统,专为 AI Agent 设计
镜像介绍
Agentic OS是阿里云基于自研的操作系统Alibaba Cloud Linux为Agent设计的衍生操作系统,它提供Agent最佳的运行环境,提升阿里云客户使用Agent的体验。Agentic OS完全兼容 Alinux4 所有能力(内核优化、云原生支持等),围绕 Agent 的认知方式和工作模式,构建全新的OS架构。
层级 | 组件 | 说明 |
封装交互层 | Copilot Shell(cosh) | 替代默认 Shell,支持自然语言 + bash 双模交互 |
OS Skills | 内置技能包机制,Agent 通过 Skill 说明书与运行时层、基础系统层交互获得部署、运维、诊断、可观测等"动手能力" | |
运行时层 | AgentSecCore | 从系统加固、沙箱隔离、Skill 签名到隐私保护,构建 OS 级纵深安全防线,确保 Agent 在受控、可审计、最小权限的环境中安全运行 |
AgentSight | 一款基于eBPF技术的 AI Agent 可观测性工具,能够在无侵入、零修改前提下,对运行在 Linux 系统上的 AI Agent 进行实时监控,捕获其LLM API 调用、Token 消耗及进程行为。 | |
基础系统层 | Alinux4 | 兼容 Alinux4 所有能力(内核优化、云原生支持等) |
适用范围
Agentic OS 适用范围说明:
适用于多种实例规格族,包括弹性裸金属服务器。更多信息,请参见实例规格族。
仅支持X86的CPU架构
支持实例内存建议>=2GB
适用于各种 Agent 场景工作负载,包括 OpenClaw、CoPaw、Claude Code 等主流 Agent 框架
费用
Agentic OS 是免费的操作系统镜像,但使用镜像时,需要支付其他资源产生的费用,如大模型调用,vCPU、内存、存储、公网带宽和快照等。
核心优势
极致Token经济型
将复杂的OS专家知识封装为标准化 Skill ,大幅减少执行环境理解以及试错探索的Token开销,实现从意图到执行的零延迟闭环。自然语言重新定义人机交互
首次将 cosh(Copilot Shell)作为默认交互入口,用户通过自然语言即可驱动操作系统完成环境部署、工具安装等日常运维操作,告别复杂命令行记忆,带来操作方式上的根本性变革。Skill 全链路安全加密,构筑内生安全防线
对每个 Skill 实施数字签名与加密保护,调用前强制身份鉴权与完整性校验,结合硬件级安全沙箱隔离异常行为,从 OS 内核层面确保 Agent 在受控、可审计、最小权限的环境中安全运行。
核心组件简介
Cosh(Copilot Shell)
Copilot Shell(cosh)是 Alibaba Cloud Linux 4 Agentic Edition 的默认交互式 Shell,替代 bash 作为系统登录后的第一入口。
cosh 的核心设计理念是「双模交互」。自然语言模式下,用户直接用中文或英文描述意图,系统借助大模型将其转化为可执行的系统操作;命令模式下,用户可通过 ! 前缀快速执行 Shell 命令,或通过 /bash 回退到全功能交互式 bash。两种模式自由混合,无需切换环境。
在保留完整 bash 兼容性的基础上,cosh 增加了自然语言理解、Skill 调用、MCP 工具集成和多级审批控制等能力。cosh 将复杂的系统级能力抽象为自然语言交互,又集成了OS Skills 说明书,降低了操作系统的使用门槛,使人类用户和 Agent 智能体都能以简单的方式驱动操作系统完成任务。
OS Skills
OS Skills是 Agentic OS 为 AI Agent 编写的操作系统使用手册。
传统操作系统文档面向人类用户,依赖自然语言描述、截图示例和行业潜在共识。Agent 在阅读这类文档时,需要消耗大量 Token 进行理解。OS Skills 说明书将操作系统知识重新组织为 Agent 可直接理解和执行的结构化格式——SKILL,Agent 不再需要「读懂文档再操作」,而是「读到即能做」。
OS Skills 说明书已覆盖两大领域:
说明书领域 | 对应知识域 | 覆盖内容 |
system-admin | 系统管理 | 用户与权限管理、系统服务管理、内核升级等基础系统管理操作 |
security | 系统安全 | 系统安全基线检查、漏洞扫描与修复等 |
system-ops | 系统运维 | 提供Linux常见性能以及稳定性问题的诊断能力 |
Agent 在接收到用户意图后,自动匹配对应的 Skill 并执行,无需人工指定调用路径。
AgentSecCore
AgentSecCore是面向 AI Agent 运行平台的操作系统级安全内核。在 AI Agent 逐步获得操作系统级别的执行能力(包括文件读写、网络访问、进程管理等)的背景下,传统应用安全边界已不再适用。AgentSecCore 从 OS 层面为 Agent 构建纵深防御体系,确保 Agent 在受控、可审计、最小权限的环境中安全运行。
AgentSecCore 作为所有业务 Skill 之上的安全监督层运行,目前采用四阶段纵深防御架构,从底层操作系统到上层应用逐层加固,架构自下而上为:
层级 | 防护能力 | 技术实现 |
Phase 1 | Skill资产完整性校验 | PGP 签名 + SHA256 哈希 + Manifest |
Phase 2 | 系统隐私信息保护 | SKILL 规则 + DLP |
Phase 3 | 系统安全加固 | LoongShield seharden 基线扫描与加固 |
Phase 4 | 沙箱隔离 | Bubblewrap + Landlock + seccomp |
AgentSight
AgentSight 是面向 AI Agent 运行平台的操作系统级可观测组件。尽管 AI Agent 的能力不断增强,其在实际运行中也暴露出Token 消耗常远超用户预期的问题:一次看似简单的对话,背后可能触发了多轮工具调用与上下文重组, Token 开销可达用户直觉估计的数倍乃至数十倍,而用户却缺乏有效的感知与追溯手段。
为此,Agentsight 构建了一套完整的 Agent 可观测性体系。该方案在零侵入业务逻辑的前提下,实现了对 Agent 运行全链路的细粒度数据采集与关联分析。这不仅帮助开发者清晰还原交互轨迹,更能支撑对 Token 消耗的精准归因及异常行为的快速定位。
Agentsight主要包含以下能力:
Token消耗分析:对 Agent 运行过程中的 Token 消耗进行全方位度量与归因。支持按时间段或最近 N 小时灵活查询,可自动环比对比。支持按智能体、任务、角色等多维度拆分消耗来源,分析粒度可精确至单次 LLM 调用。
行为审计:对 Agent 的 LLM 调用及进程执行行为的全链路记录与追踪。在数据采集中,完整留存每次 LLM 调用的提供商、模型版本等关键元数据,并同步捕获进程的命令行参数。此外,系统支持按时间维度、进程标识及事件类型进行多维度灵活筛选,并提供可视化的汇总统计分析能力。