本文介绍如何在容器环境下配置JVM堆参数大小。

背景信息

当您的业务是使用Java开发,且设置的JVM堆空间过小时,程序会出现系统内存不足OOM(Out of Memory)的问题。特别是在容器环境下,不合理的JVM堆参数设置会导致各种异常现象产生,例如应用堆大小还未到达设置阈值或规格限制,就因为OOM导致重启等。

通过-XX:MaxRAMPercentage限制堆大小(推荐)

  • 在容器环境下,Java只能获取服务器的配置,无法感知容器内存限制。您可以通过设置-Xmx来限制JVM堆大小,但该方式存在以下问题:
    • 当规格大小调整后,需要重新设置堆大小参数。
    • 当参数设置不合理时,会出现应用堆大小未达到阈值但容器OOM被强制关闭的情况。
      说明 应用程序出现OOM问题时,会触发Linux内核的OOM Killer机制。该机制能够监控占用过大内存,尤其是瞬间消耗大量内存的进程,然后它会强制关闭某项进程以腾出内存留给系统,避免系统立刻崩溃。
  • 推荐的JVM参数设置。
    -XX:+UseContainerSupport -XX:MaxRAMPercentage=70.0 -XX:+PrintGCDetails -XX:+PrintGCDateStamps -Xloggc:/home/admin/nas/gc-${POD_IP}-$(date '+%s').log -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/home/admin/nas/dump-${POD_IP}-$(date '+%s').hprof

    参数说明如下。

    参数 说明
    -XX:+UseContainerSupport 使用容器内存。允许JVM从主机读取cgroup限制,例如可用的CPU和RAM,并进行相应的配置。当容器超过内存限制时,会抛出OOM异常,而不是强制关闭容器。
    -XX:MaxRAMPercentage 设置JVM使用容器内存百分比。由于存在系统组件开销,建议最大不超过75.0,推荐设置为70.0。
    -XX:+PrintGCDetails 输出GC详细信息。
    -XX:+PrintGCDateStamps 输出GC时间戳。日期形式,例如2019-12-24T21:53:59.234+0800。
    -Xloggc:/home/admin/nas/gc-${POD_IP}-$(date '+%s').log GC日志文件路径。需保证Log文件所在容器路径已存在,建议您将该容器路径挂载到NAS目录,以便自动创建目录以及实现日志的持久化存储。
    -XX:+HeapDumpOnOutOfMemoryError JVM发生OOM时,自动生成DUMP文件。
    -XX:HeapDumpPath=/home/admin/nas/dump-${POD_IP}-$(date '+%s').hprof DUMP文件路径。需保证DUMP文件所在容器路径已存在,建议您将该容器路径挂载到NAS目录,以便自动创建目录以及实现日志的持久化存储。
    说明
    • 该特性支持JDK 8u191+、JDK 10及以上版本。
    • 如果您没有将文件挂载到NAS目录,必须保证/home/admin/nas路径存在,否则不会产生日志。

通过-Xms -Xmx限制堆大小

  • 您可以通过设置-Xms-Xmx来限制堆大小,但该方式存在以下两个问题:
    • 当规格大小调整后,需要重新设置堆大小参数。
    • 当参数设置不合理时,会出现应用堆大小未达到阈值但容器OOM被强制关闭的情况。
      说明 应用程序出现OOM问题时,会触发Linux内核的OOM Killer机制。该机制能够监控占用过大内存,尤其是瞬间消耗大量内存的进程,然后它会强制关闭某项进程以腾出内存留给系统,避免系统立刻崩溃。
  • 推荐的JVM参数设置。
    -Xms2048m -Xmx2048m -XX:+PrintGCDetails -XX:+PrintGCDateStamps -Xloggc:/home/admin/nas/gc-${POD_IP}-$(date '+%s').log -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/home/admin/nas/dump-${POD_IP}-$(date '+%s').hprof

    参数说明如下。

    参数 说明
    -Xms 设置JVM初始内存大小。建议与-Xmx相同,避免每次垃圾回收完成后JVM重新分配内存。
    -Xmx 设置JVM最大可用内存大小。为避免容器OOM,请为系统预留足够的内存大小。
    -XX:+PrintGCDetails 输出GC详细信息。
    -XX:+PrintGCDateStamps 输出GC时间戳。日期形式,例如2019-12-24T21:53:59.234+0800。
    -Xloggc:/home/admin/nas/gc-${POD_IP}-$(date '+%s').log GC日志文件路径。需保证Log文件所在容器路径已存在,建议您将该容器路径挂载到NAS目录,以便自动创建目录以及实现日志的持久化存储。
    -XX:+HeapDumpOnOutOfMemoryError JVM发生OOM时,自动生成DUMP文件。
    -XX:HeapDumpPath=/home/admin/nas/dump-${POD_IP}-$(date '+%s').hprof DUMP文件路径。需保证DUMP文件所在容器路径已存在,建议您将该容器路径挂载到NAS目录,以便自动创建目录以及实现日志的持久化存储。
  • 推荐的堆大小设置。
    内存规格大小 JVM堆大小
    1 GB 600 MB
    2 GB 1434 MB
    4 GB 2867 MB
    8 GB 5734 MB

通过ossutil下载堆转储文件

  1. 挂载容器日志目录至NAS。具体操作,请参见设置NAS存储
  2. 设置JVM参数。
    其中Dump文件路径/home/admin/nas为NAS挂载目录:
    -Xms2048m -Xmx2048m -XX:+PrintGCDetails -XX:+PrintGCDateStamps -Xloggc:/home/admin/nas/gc-${POD_IP}-$(date '+%s').log -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/home/admin/nas/dump-${POD_IP}-$(date '+%s').hprof
  3. 当应用发生OOM时,会生成堆转储文件到NAS挂载目录,您可以利用ossutil工具,将该Dump文件下载到本地进行分析。具体操作,请参见通过日志上传下载诊断应用

常见问题

  1. 容器出现137退出码的含义是什么?
    当容器使用内存超过限制时,会出现容器OOM,导致容器被强制关闭。此时业务应用内存可能并未达到JVM堆大小上限,所以不会产生Dump日志。建议您调小JVM堆大小的上限,为容器内其他系统组件预留足够多的内存空间。m_exitcode_137
  2. 堆大小和规格内存的参数值可以相同吗?

    不可以。因为系统自身组件存在内存开销,例如使用SLS进行日志收集时会占用一小部分的内存空间,所以不能将JVM堆大小设置为和规格内存大小相同的数值,需要为这些系统组件预留足够的内存空间。

  3. 在JDK 8版本下设置-XX:MaxRAMPercentage值为整数时报错怎么处理?

    这是JDK 8的一个Bug。具体信息,请参见Java Bug Database

    例如,在JDK 8u191版本下,设置-XX:MaxRAMPercentage=70,这时JVM会启动报错。

    m_JDK8_bug
    解决方案如下:
    • 方式一:设置-XX:MaxRAMPercentage70.0
      说明 如果您使用了-XX:InitialRAMPercentage-XX:MinRAMPercentage,参数值同样不可设置为整数,需按照方式一的形式来设置。
    • 方式二:升级JDK版本至JDK 10及以上版本。