本文介绍了操作系统控制台的最新动态,这些功能的发布旨在增强系统管理能力,以满足不断变化的应用需求。我们致力于提供卓越的操作系统性能,提升操作系统的使用效率,并为用户带来全新的操作体验。
背景信息
操作系统控制台支持的操作系统包括CentOS、Alibaba Cloud Linux、Anolis、Ubuntu等操作系统的特定版本。
更新内容适用的地域请参见相关文档中的地域限制说明。
2025年7月
功能名称 | 功能模块 | 功能概述 | 发布时间 | 相关文档 |
FastOOM | 组件管理 | 启用后将会监控节点级别内存压力,触发节点级别FastOOM杀进程功能,有效避免系统响应慢或无响应的情况。 | 2025-07-30 | |
ACS Pod诊断 | 系统诊断 | 支持对 ACK 集群管理的 Pod 进行诊断,通过 k8s 的命名空间和Pod名称来对特定的 Pod 进行诊断。 | 2025-07-30 | |
告警投递 | 系统概览 | 在发生异常事件时,如CPU使用率异常等情况,会以多种渠道发送通知,以便用户快速响应和处理。 | 2025-07-30 | |
内存全景 | 系统诊断 | 新增 | 2025-07-30 | |
宕机诊断 | 系统诊断 | 支持hardlock和hung task分析。 | 2025-07-30 | |
AI 观测 | AI观测 | 支持导出诊断结果报告,用于离线查看。 | 2025-07-30 | |
支持Ubuntu 22.04、Ubuntu 24.04。 |
2025年6月
功能名称 | 功能模块 | 功能概述 | 发布时间 | 相关文档 |
健康度异常事件 | 系统概览 | 新增 | 2025-06-30 | |
配置管理 | 组件管理 | 支持功能的开启及配置:FastOOM根据灵活配置杀死相关进程,避免系统陷入OOM前的响应慢或无响应状态。 | 2025-06-30 | |
灰度部署 | 组件管理 | 支持ACK集群以节点数量、百分比及ACK节点标签灰度部署组件。 | 2025-06-30 | |
非纳管诊断 | 系统诊断 | 支持非纳管实例直接使用系统诊断功能。 | 2025-06-30 | |
AI观测 | AI观测 |
| 2025-06-30 |
2025年3月
功能名称 | 功能模块 | 功能概述 | 发布时间 | 相关文档 |
节点监控 | 系统管理 | 查看节点的网络监控、IO监控、调度监控以及内存监控信息。 | 2025-03-31 | |
AI诊断 | AI诊断 | 对AI业务场景中的系统异常进行诊断,并生成相关的诊断结论、GPU运行状态及AI作业运行状态. | 2025-03-26 | |
配置java热点追踪 | 进程热点追踪 | 追踪JAVA进程的热点并采集JAVA栈信息。 | 2025-03-12 |
2024年12月
功能名称 | 功能模块 | 功能概述 | 发布时间 | 相关文档 |
集群健康 | 系统概览 | 支持多集群维度展示集群的健康状态,并具备集群切换的功能。 | 2024-12-30 | |
异常事件反馈 | 支持用户对异常事件的反馈,并根据反馈调整异常事件的上报频率及基线。 | 2024-12-30 | ||
IO一键诊断 | 系统诊断 | IO一键诊断专注于高频出现的IO高延迟、IO Burst及IO Wait等问题。 | 2024-12-30 | |
网络抖动诊断 | 诊断工具旨在分析由于收包慢、软中断及调度器引起的网络抖动问题,并提供具体原因及解决方案。 | 2024-12-30 | ||
系统负载诊断 | 系统负载诊断旨在分析系统一分钟平均负载(load1指标)的异常原因和详细信息 | 2024-12-30 | ||
宕机诊断 | 宕机诊断专注于分析宕机的原因并给出修复建议。 | 2024-12-30 | ||
AI Infra观测 | 系统观测 | AI Infra观测通过动态注入GPU Profiling采集AI作业运行过程中的算子、调度以及Kernel函数等信息进行综合分析,以实现零侵入、高灵活性和低开销的AI观测作业。 | 2024-12-30 | |
集群部署 | 组件管理 | 组件管理新增了ACK集群纳管功能,并支持集群内实例的弹性伸缩。 | 2024-12-30 | |
取消订阅 | 订阅管理 | 支持通过控制台取消订阅的CentOS安全更新及Alinux 2 ELS订阅。 | 2024-12-30 | |
诊断引导 | OS Copilot | 支持OOM等异常的诊断引导。 | 2024-12-30 | |
文档链接引用 | 支持回答中文档链接的引用。 | 2024-12-30 |