Linux实例存在OOM问题的处理方法

Linux实例存在OOM问题的处理方法

更新时间:2020-07-20 16:26:53

概述

本文主要介绍当您的Linux实例存在OOM问题的处理方法。

详细信息

阿里云提醒您:

  • 如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。
  • 如果您对实例(包括但不限于ECS、RDS)等进行配置与数据修改,建议提前创建快照或开启RDS日志备份等功能。
  • 如果您在阿里云平台授权或者提交过登录账号、密码等安全信息,建议您及时修改。

请参考以下步骤进行排查:

  1. 请您参考以下信息,尝试分析OOM的根本原因。
    信息点 获取途径 备注
    OOM发生的时间和频率
    • Linux系统日志
    • 您的业务应用日志

    Linux系统日志路径如下:

    /var/log/message
    Linux实例的系统负载情况 推荐使用云监控查询您的ECS实例负载信息。如果您没有使用云监控产品,您可以通过freetopsar命令查看内存信息。更多信息,请参见Linux实例系统总体负载的查询及分析
    您的业务负载情况 您的业务应用日志 根据OOM发生的时间,检查业务应用日志中触发OOM的原因。
    OOM发生时的应用日志
  2. 根据以下OOM原因进行处理:
    • 当前Linux实例的内存不足以支撑业务的运行
      您可以升级实例内存配置。
      注意:升级配置需要重启实例,请在合适的时间段升级内存配置。
    • 您的业务程序存在缺陷
      您可以根据业务应用日志中出现的问题优化您的业务代码。
  3. 继续观察,确认OOM问题不再出现。

适用于

  • 云服务器ECS