SysOM EnhanceOOMCollector功能

增强OOM采集(EnhanceOOMCollector)功能通过监控 Pod 内存的使用情况,预测 OOM 的发生,在OOM发生之前预采集现场的内存信息,在OOM发生后可以提供更丰富的现场内存信息,包括系统的内存使用情况,Pod的内存使用情况, 以及应用内存的使用情况

使用限制

地域限制

本功能目前仅支持中国内地与中国香港。

操作系统限制

架构

操作系统

x86架构

  • Alibaba Cloud Linux 2/3

  • Alibaba Cloud Linux 3 Pro

  • Alibaba Cloud Linux 3 容器优化版

  • Rocky Linux 9.5

  • Rocky Linux 9.1

  • Rocky Linux 8.8

  • Ubuntu 22.04

  • CentOS 7.6及更高版本,或CentOS 8

  • Anolis OS 7/8

  • Ubuntu 24.04

  • Ubuntu 20.04

ARM架构

  • Alibaba Cloud Linux 3

  • Alibaba Cloud Linux 3 Pro

前提条件

  • 如果您使用RAM用户,请确保阿里云账号(主账号)已将系统策略AliyunECSReadOnlyAccessAliyunSysomFullAccess授予RAM用户。

  • 首次登录操作系统控制台时,需授权开通控制台服务。

功能说明

EnhanceOOMCollector 开启后会有轻微的常驻内存开销(10MB~30MB);

功能状态

实际效果

开启增强OOM采集,未开启Java内存采集

  1. OOM事件会自动保存,即便实例重启或者Pod销毁也能进行OOM诊断;

  2. Pod发生OOM之前会采集现场系统的和Pod的内存使用情况,在OOM诊断分析时提供丰富的现场内存信息(采集的信息同 内存全景分析 的结果);

  3. Pod即便销毁,OOM诊断也可以关联是哪个Pod发生的;

开启增强OOM采集,开启Java内存采集

在上述效果的基础上,如果 Pod 占用内存较高的是Java程序,会在OOM发生之前采集 Java 进程的内存信息(采集的信息同 Java内存诊断 结果)。

关闭增强OOM采集功能

  1. OOM诊断基于日志分析到,信息有限;

  2. Pod销毁则无法关联OOM属于哪个Pod;

  3. 系统重启后无法对重启前的OOM进行这怒但。

SysOM组件版本大于等于3.9.1-1,会默认启动轻量级增强OOM信息采集功能。

启用轻量级OOM增强信息采集功能

参考组件管理的操作步骤,给目标实例升级到 3.9.1-1版本以上即可。

启用带Java内存追踪的OOM增强信息采集功能

  1. 访问操作系统控制台-组件管理

  2. 为目标ECS实例安装组件

  3. 返回组件管理页面,单击详情。

    image

  4. 单击创建配置,配置开启Java内存采集功能。

    image

  5. 在左侧导航栏,单击系统管理

  6. 在已纳管页签中勾选要应用增强OOM的节点,单击变更组件

  7. 选择已创建的SysOM组件配置,单击提交

关闭OOM增强信息采集功能

  1. 访问操作系统控制台-组件管理

  2. 为目标ECS实例安装组件

  3. 返回组件管理页面,单击详情。image

  4. 单击创建配置,关闭Java内存采集功能。image

  5. 在左侧导航栏,单击系统管理

  6. 在已纳管页签中勾选要应用增强OOM的节点,单击变更组件

  7. 选择已创建的SysOM组件配置,单击提交