💠

💠 2024-12-24 10:16:38


JVM

JVM结构及设计

Oracle JDK 默认采用的是 Hotspot JVM

Java Language and Virtual Machine Specifications

Github:jvm学习仓库 个人博客: JVM归类

书籍

  • 《深入理解 Java 虚拟机》(周志明 第二版) 大部分内容来源于此, 但是部分内容是依据Java8有所改动

社区

JVM参数

Command Reference for JDK8 | Command Reference for JDK17
Official: Java HotSpot VM Options
Guide to the Most Important JVM Parameters

Jvm启动参数配置建议 | 郭工gyf的记录

  • 远程调试

  • -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=9999 -Dcom.sun.management.jmxremote.authenticate=false -Dcom.sun.management.jmxremote.ssl=false

    • 开启无需认证 非SSL的JMX端口: 9999
  • -XX:+TraceClassLoading -XX:+TraceClassUnloading 输出类装载/卸载日志,可用于排查类从哪个jar加载进入JVM的

    • Java9及以后替代为: -Xlog:class+load=info

OOM

  • -XX:+HeapDumpOnOutOfMemoryError
  • -XX:HeapDumpPath=./java_pid<pid>.hprof 注意路径需要存在,JVM不会创建不存在的目录
  • -XX:OnOutOfMemoryError="< cmd args >;< cmd args >"
  • -XX:+UseGCOverheadLimit

字符串

  • -XX:+UseStringCache
  • -XX:+UseCompressedStrings
  • -XX:+OptimizeStringConcat
  • -XX:+UseStringDeduplication

编译类参数

  • CICompilerCount是JIT进行热点编译的线程数,和并发标记线程数一样,热点编译也是CPU密集型任务,默认值为2。 在CICompilerCountPerCPU开启的时候(JDK7默认关闭,JDK8默认开启),手动指定CICompilerCount是不会生效的,JVM会使用系统CPU核数进行计算。 所以当使用JRE8并且版本小于1.8.0_131,采用默认参数时,CICompilerCount会在20左右,对业务性能影响较大,特别是启动阶段。建议升级Java版本,特殊情况要使用老版本Java 8,请加上-XX:CICompilerCount=[n], 同时不能指定-XX:+CICompilerCountPerCPU ,下表给出了生产环境下常见规格的推荐值。
CPU核数 1 2 4 8 16
推荐值 2 2 3 3 8

JVM内存参数

堆(老年代 年轻代),堆外,元空间,栈

内存参数设置的考量: Xmx * 110% + MaxDirectMemorySize + 系统预留内存 <= 容器内存

  • Xmx * 110% 中额外的10%是留给其他堆外内存的,是个保守估计,个别业务运行时线程较多时,还需加上 Xss * 线程数
  • 系统预留内存512M到1G,视容器规格而定
  • I/O较多的业务适当提高MaxDirectMemorySize比例(Netty和NIO使用到)

快速确认进程内存配置

工具 命令
Arthas jvm
OpenJDK jcmd pid GC.heap_info
OracleJDK jmap -heap pid
  • -XX:CompressedClassSpaceSize=500m 压缩的类元空间大小 默认是1g
  • -XX:SurvivorRatio 配置 Edgen 和 单个Survivor 的比例, 如果配置为2 则是 2:1:1。 默认是8
  • -XX:NewRatioold/new 内存的比值 默认是2
  • -Xmn MaxNewSize 默认值是Xmx的1/3 即最大堆内存 MaxHeapSize 的1/3
  • -Xss 设置 ThreadStackSize 线程的栈内存大小 默认值 1024k
  • -XX:+AlwaysPreTouch 堆内存分配时,直接分配物理内存而不是虚拟内存,分配的物理内存会做0值初始化(单线程执行),好处是后续申请内存时无须分配和初始化,缺点是启动更耗时。
    • 申请内存的场景(年轻代晋升,新对象分配)

java -XX:+PrintFlagsFinal -version

  • -XX:+PrintFlagsInitial 输出初始默认值
  • -XX:+PrintFlagsFinal 输出JVM最终属性值
    • MaxHeapSize 最大堆内存
    • MaxRAMFraction 默认最大内存占物理机内存的比例 JDK6,7,8 都是4 即1/4
    • NUMA 机制
    • java -XX:+PrintFlagsFinal -version | grep "Use.*GC" 查看默认GC实现
  • -XshowSettings:VM 展示VM和系统信息

需要理解,但是不用,尽量使用明确的 Xmx Xms

JVM Parameters InitialRAMPercentage, MinRAMPercentage, and MaxRAMPercentage

  • MinRAMPercentage, MaxRAMPercentage 其实都是设置堆默认最大值的, Max 和 Min 换成 Big Small可能更好理解(大内存环境和小内存环境 200M划分)
  • -XX:InitialRAMPercentage 初始堆使用值 默认1.5625, 当配置了 -Xms 时,该配置将被忽略
  • InitialRAMFraction MaxRAMFraction MinRAMFraction DefaultMaxRAMFraction 4等分值

容器内的JVM

容器无法感知资源限制, 8U191/10b34 及以上版本才支持

  • 快速实验某个Java版本的默认参数和限制 docker run -m 100MB openjdk:8 java -XX:MinRAMPercentage=80.0 -XshowSettings:VM -version
  • 参考: Java和Docker限制的那些事儿天坑: 低版本的Jvm无法感知到Docker的资源限制
  • 但是有的Linux版本在后续的版本也无法感知,例如 1.8.0_342 10.0.2 仍取的主机内存, Linux 5.15内核 Manjaro23.1
  1. Java (prior to JDK8 update 131) applications running in docker container CPU / Memory issues?
  2. Best Practices: Java Memory Arguments for Containers

总结: 尽量使用 Xms Xmx,而不是 RAMPercentage RAMFractionc参数(还要结合容器或宿主机计算实际值),降低维护和理解成本,控制更灵活精确,且支持所有版本JVM,不用考虑兼容性问题

参数:

  • -XX:ActiveProcessorCount=$CONTAINER_CORE_LIMIT 强制设置CPU量 从downawrd_api获取
  • -Xlog:os+container=logLevel JVM报告容器信息
  • -XX:-UseContainerSupport 关闭容器支持,默认开启

内存参数实践

初始和最大堆内存设置为一样的好处 Benefits of setting initial and maximum memory size to the same value

  • 避免扩容的暂停事件,提前调度充足资源的容器防止运行期扩容而被Linux被OOMKiller杀掉

参考: JVM实用参数(一)JVM类型以及编译器模式
xxfoxJvm参数辅助工具
参考: JVM动态反优化

Unified JVM Logging

JEP 158: Unified JVM Logging

Java9开始,整合了GC,类加载等日志配置方式,日志级别,输出方式 正交式声明使用,更统一及灵活。


JVM 基本结构

JVM基本结构

  • 类加载器子系统
    • 负责从文件系统或者网络中记载Class信息,加载的类信息存放于一块称为方法区的内存空间。除了类的信息外,方法区中可能还会存放运行时的常量池信息,包含字符串字面量和数字常量(这部分常量信息是Class文件中常量池部分的内存映射)
  • Java堆
    • 在虚拟机启动的时候建立,他是Java程序最主要的内存工作区域。几乎所有Java对象实例都存放于Java堆中。堆空间是所有线程共享的,这是一块与Java应用密切相关的内存区间
    • Java的NIO库允许Java程序使用直接内存。直接内存是Java堆外的、直接向系统申请的内存区间。通常,访问直接内存的速度优于Java堆。因此出于性能考虑,读写频繁的场合可能会考虑使用直接内存。由于直接内存在Java堆外,因此他的大小不会直接受限于Xmx指定的最大堆大小,但是系统内存是有限的,Java堆和直接内存的总和依然受限于操作系统能给出的最大内存
  • 垃圾回收系统
    • 是Java虚拟机的重要组成部分,垃圾回收器可以对方法区、Java堆和直接内存进行回收。其中,Java堆是垃圾回收器的工作重点。和C/C++不同,Java中所有的对象空间释放都是隐式的。也就是说,Java中没有类似free()和delete()这样的函数释放指定的内存区域,对于不再使用的垃圾对象,垃圾回收系统会在后台默默工作,默默查找、标识并释放垃圾对象,完成Java堆、方法区和直接内存中的全自动管理。
  • Java虚拟机栈
    • 每一个Java虚拟机线程都有一个私有的Java栈。一个线程的Java栈在线程创建的时候被创建。Java栈中保存着帧信息,Java栈中保存着局部变量、方法参数,同时和Java方法的调用、返回密切相关。
  • 本地方法栈
    • 和Java栈非常类似,最大的不同在于Java栈用于Java方法的调用,而本地方法栈则用于本地方法调用。作为Java虚拟机的重要扩展,Java虚拟机允许Java直接调用本地方法。
  • PC寄存器
    • 也是每个线程私有的空间,Java虚拟机会为每一个Java线程创建PC寄存器。在任意时刻,一个Java线程总是在执行一个方法,这个正在被执行的方法称为当前方法。如果当前方法不是一个本地方法,PC寄存器就会指向当前正在被执行的指令。如果当前方法是本地方法,那么PC寄存器的值就是undefined。
  • 执行引擎
    • 是Java虚拟机的最核心组件之一,它负责执行虚拟机的字节码。

堆内存管理

JVM GC

非堆内存管理 glibc

Linux Glibc

注意JVM所有内存的申请和返还都是通过 glibc 实现的,因此不建议使用Alpine作为基础镜像,因为会有行为上的不一致,Alpine使用的是 musl libc(核心源码只有不到 400 行)。
从一次 CTF 出题谈 musl libc 堆漏洞利用本文通过一道 CTF 题目展示 musl libc 堆溢出漏洞的利 - 掘金

但是glibc在高并发场景下也有缺点: How glibc Memory Handling Affects Java Applications: The Hidden Cost of Fragmentation
在高并发请求的应用系统上,会有大量对象创建和销毁,堆内的内存管理有GC,但是非堆的内存,例如 DirectMemory 等等会因为glibc的设计出现内存碎片,内存延迟返还操作系统的情况 优化方案:

  • 将 glibc 替换为 jemalloc java -Djava.library.path=/path/to/jemalloc -jar YourApplication.jar
  • 限制 glibc 的内存池 export MALLOC_ARENA_MAX=2 环境变量
    • MALLOC_ARENA_MAX=1 与 MALLOC_ARENA_MAX=4有什么区别? | easyice
    • 该设计是为了在高并发的场景申请内存时直接从Arena内存申请,而不需要再通过 mmap sbrk等系统调用,并且为了降低多线程申请时的竞争,会最多创建cpucore*8个Arena,此类可以称为 thread arena ,进程只有一个 main arena 作为兜底空间
    • thread arena 的内存需要等待 才会释放,本质上是系统内有长生命周期的对象存在导致
  • 优化系统代码,减少非堆内存使用场景。

内存区域

alt text

Java 进程内存占用及可观测性调研&内存异常排查最佳实践深入探究内存分布细节
谈JVM xmx, xms等内存相关参数合理性设置

java - Why does the Sun JVM continue to consume ever more RSS memory even when the heap, etc sizes are stable? - Stack Overflow

运行时数据区

alt text

线程私有的内存区域: 程序计数器 本地方法栈 虚拟机栈. 生命周期与线程保持一致

程序计数器

可以看作是当前线程所执行的字节码的行号指示器, 这个内存区域是唯一一个在JVM规范中没有规定任何 OutOfMemoryError 的区域

Java虚拟机栈

HotSpot 中不区分Java虚拟机栈和本地方法栈, 虽然 -Xoss 存在(设置本地方法栈大小)但是是无效的, 只能通过 -Xss 设置 且可以通过NMT看到所有线程数及占用的非堆内存

  • 虚拟机栈描述的是Java方法执行的内存模型: 每个方法在执行的同时, 都会创建一个栈帧(Stack Frame)

    • 用于存储局部变量表, 操作数栈, 动态链接, 方法出口等信息
    • 在一个栈帧中,至少要包含局部变量表、操作数栈和帧数据。
  • 每个方法调用到执行完成的过程, 就对应着一个栈帧在虚拟机栈中入栈到出栈的过程

  • 局部变量表

    • 存放了编译期可知的各种 基本数据类型, 对象引用, returnAddress 类型
      • 对象引用: reference 类型, 不等同于对象本身, 可能是一个指向对象地址的引用指针, 可能是一个代表对象的句柄, (可能是其他与此对象相关的位置?)
      • returnAddress: 指向了一条字节码指令的地址
    • 只有 long double 类型 会占用 2 个局部变量空间, 其他类型都只占用 1 个
    • 局部变量表所需的内存空间在编译后就已经确定下来, 运行期是不会变的
  • Java虚拟机规范中对该内存区域定义了两种异常状况

    • 如果线程请求的栈深度大于虚拟机所允许的最大深度, 将抛出 StackOverFlowError
    • 如果虚拟机在扩展栈时, 无法申请到足够的内存, 则抛出 OutOfMemoryError 异常

本地方法栈

Native Method Stack, 与虚拟机栈所发挥的作用是相似的, 只不过虚拟机栈是为虚拟机执行Java方法服务, 本地方法栈是为了虚拟机使用 Native 方法服务

Heap 堆

Java虚拟机规范中的描述是 所有对象实例以及数组都是在堆上分配, 但是由于 JIT编译器 逃逸分析 栈上分配, 标量替换等技术, 就变得没那么绝对了

堆分为 新生代(包含: Eden, Survivor from, Survivor to) 老年代
从堆和栈的功能和作用来通俗的比较,堆主要用来存放对象的,栈主要是用来执行程序的.
JVM是基于堆栈的虚拟机.JVM为每个新创建的线程都分配一个堆栈.也就是说,对于一个Java程序来说,它的运行就是通过对堆栈的操作来完成的。
堆栈以栈帧为单位保存线程的状态。JVM对堆栈只进行两种操作:以帧为单位的压栈和出栈操作。

参考: Java中堆内存和栈内存详解

堆内存分配策略

  • 对象的内存分配, 粗略讲就是在堆上分配(但也可能经过JIT编译后被拆散成标量类型并间接地栈上分配)
  • 对象主要分配在Eden; 如果启动了本地线程分配缓冲, 则优先在TLAB上分配; 也有直接分配在老年代的 (长字符串以及数组)
  1. 类变量(static修饰的变量) 在程序加载时系统就为它在堆中开辟了内存,堆中的内存地址存放于栈以便于高速访问。
    • 生命周期: 从应用进程启动一直到进程停止
  2. 实例变量 当你使用java关键字new的时候,系统在堆中开辟并不一定是连续的空间分配给变量(比如说类实例),然后根据零散的堆内存地址,通过哈希算法换算为一长串数字以表征这个变量在堆中的"物理位置"。
    • 生命周期: 当实例变量的引用丢失后,将被GC(垃圾回收器)列入可回收“名单”中,但并不是马上就释放堆中内存
  3. 局部变量 局部变量,由声明在某方法,或某代码段里(比如for循环),执行到它的时候在栈中开辟内存
    • 生命周期: 当局部变量一但脱离作用域,内存立即释放

  • 如果对象在 Eden 出生, 并经过一次 MinorGC后存活, 并能被 Survivor 容纳, 将被移入 Survivor 且年龄为1.
    • 对象在 Survivor 每经过一次 MinorGC 年龄加1, 当达到 MaxTenuringThreshold(默认15) 就会移入老年代
  • 如果 Survivor 空间中相同年龄所有对象大小的总和大于 Survivor 空间的一半, 年龄大于等于该年龄的对象都将进入老年代, 无需等到设置的 MaxTenuringThreshold

堆内存配置: 新生代一般设置为整个堆空间的1/3到1/4左右最合适。
新生代内存不能过大也不能过小, 过大则老年代内存过小, 导致频繁 FullGC
过小则导致对象全在老年代分配,新生代上无法分配(Allocation Failure) 也将导致频繁 Full GC

方法区 Java7

方法区存在于永久代 Perm Gen, 对应于Java8中的MetaSpace

用于存放 Class 相关信息, 常量, 静态变量, 访问修饰符, 字段描述, 方法描述, JIT编译器编译后的代码等数据
在 HotSpot 虚拟机上, 方法区也看做是 永久代 Permanent Gen, 两者关系是: 方法区是Java虚拟机规范, 永久代是方法区在Hotspot上的实现
从Java8开始, 永久代已经被 MetaSpace(操作系统的直接内存) 取代

JDK7中符号表被移动到 Native Heap中,字符串常量池和类引用被移动到 Java Heap中。

运行时常量池是方法区的一部分, 用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池存放.

Native Memory 非堆内存

Native Memory 主要是JNI、线程栈、编译器、符号表、Deflater/Inflater、DirectByteBuffer(nio中会用到)使用的
当发现Java进程的堆使用率不高,但是进程占用内存RSS很高,就要怀疑这块区域了, 可以先通过NMT工具对每个区域进行分析,进一步可以对进程内存进行分析(pmap等工具)

Linux 虚拟内存

参考: 聊聊JVM 堆外内存泄露的BUG是如何查找的
JAVA堆外内存排查小结
Java in K8s: how we’ve reduced memory usage without changing any code

Java 进程内存占用及可观测性调研&内存异常排查最佳实践

还有两种内存 Native Memory Tracking 没有记录,那就是:

  • MMap Buffer:文件映射内存
  • JNI 方法里的内存分配

Java – Debugging Native Memory Leaks

NMT Native Memory Tracking

Native Memory Tracking

NMT Memory Categories内存各分类说明

  • 启用NMT: java -XX:NativeMemoryTracking=summary 或 detail (开销更大一些)
  • 查看NMT: jcmd $pid VM.native_memory [detail] 对应启用时设置,输出具体内存地址信息
    • summary 缺省参数,查看概览
    • detail detail模式才支持,查看内存地址明细
    • baseline 设置当前时刻为基线
    • summary.diff 对比前文设置的基线的变化值
    • detail.diff detail模式对比前文设置的基线的变化值
    • shutdown 停止 Tracking
    • scale 设置展示的单位值默认KB (MB or GB)
    • statistics detail模式输出统计信息

示例

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
Native Memory Tracking:
Total: reserved=10019737KB, committed=997089KB () reversed保留内存 (ps中的VSZ)  commited实际提交内存 (ps中的RSS)
-                 Java Heap (reserved=8222720KB, committed=514048KB)
                            (mmap: reserved=8222720KB, committed=514048KB) 
-                     Class (reserved=1081845KB, committed=34165KB) 存储类元数据信息
                            (classes #3085)
                            (malloc=14837KB #3960) 
                            (mmap: reserved=1067008KB, committed=19328KB) 
-                    Thread (reserved=54501KB, committed=54501KB)  线程占用的空间 即54线程 54M:默认栈为1M需-Xss修改
                            (thread #54)
                            (stack: reserved=54272KB, committed=54272KB)
                            (malloc=178KB #318) 
                            (arena=52KB #95)
-                      Code (reserved=250763KB, committed=9551KB) JIT代码缓存
                            (malloc=1163KB #2588) 
                            (mmap: reserved=249600KB, committed=8388KB) 
-                        GC (reserved=316571KB, committed=291487KB) GC算法需要的内存空间
                            (malloc=16151KB #155) 
                            (mmap: reserved=300420KB, committed=275336KB) 
-                  Compiler (reserved=183KB, committed=183KB)
                            (malloc=40KB #208) 
                            (arena=142KB #15)
-                  Internal (reserved=84975KB, committed=84975KB)  DirectMemory区域
                            (malloc=84943KB #16310) 
                            (mmap: reserved=32KB, committed=32KB) 
-                    Symbol (reserved=4984KB, committed=4984KB)
                            (malloc=3633KB #26295) 
                            (arena=1351KB #1)
-    Native Memory Tracking (reserved=982KB, committed=982KB) NMT自身占用内存
                            (malloc=163KB #2304) 
                            (tracking overhead=818KB)
-               Arena Chunk (reserved=2214KB, committed=2214KB)
                            (malloc=2214KB) 

Metaspace 元空间

MetaSpace Java8 引入, 取代了以往的 Perm Gen

  • 存放内容:
    • Klass结构
    • 匿名类, Lambda表达式
    • String.intern 的字符串

特性

  • 充分利用了Java语言规范:类及相关的元数据的生命周期与类加载器的一致。
  • 每个类加载器都有它的内存区域-元空间
  • 只进行线性分配
  • 不会单独回收某个类(除了重定义类 RedefineClasses 或类加载失败)
  • 没有GC扫描或压缩
  • 元空间里的对象不会被转移
  • 如果GC发现某个类加载器不再存活,会对整个元空间进行集体回收

参考: Metaspace Architecture
参考: What is Compressed Class Space?
深入理解堆外内存 Metaspace

Metaspace 解密 - 你假笨

-XX:MaxMetaspaceSize 指定元空间的最大空间,默认值是无限(16EB) -XX:MetaspaceSize 指定元空间首次扩充的大小,默认为20.75M

由于MaxMetaspaceSize未指定时,默认无上限,所以需要特别关注内存泄露的问题
如果程序动态的创建了很多类(反射,Lambda等等)或出现过java.lang.OutOfMemoryError:Metaspace, 建议明确指定-XX:MaxMetaspaceSize

Metaspace实际分配的大小是随着需要逐步扩大的,每次扩大需要执行一次FGC,-XX:MetaspaceSize默认的值是比较小的,需要频繁GC扩充到实际需要的大小。
类似日志可以看到Metaspace引起的FGC:[Full GC (Metadata GC Threshold) ...], 因此为减少预热影响,可以将-XX:MetaspaceSize,-XX:MaxMetaspaceSize指定成相同的值。

DirectMemory 堆外内存

常说的堆外内存都是指这块,即NIO使用到的缓冲区内存(直接操作系统申请,不受GC控制)。
通常出现在NMT监控中的 Internal 部分,如果发现这部分增长明显,需要排查NIO相关的代码使用和配置了。

  • how to see memory useage of nio buffers

  • -XX:MaxDirectMemorySize 限制最大内存

    • 该参数只能限制 DirectByteBuffer(Bits)申请内存的最大值,无法限制Unsafe申请内存
    • 如果未手动指定值,通过jcmd工具查看的值为0,实际取值参考:
      • 使用CMS,Parallel GC时默认值为: MaxHeapSize - Survivor
      • 使用G1时最大默认是 MaxHeapSize

Code Cache

Introduction to JVM Code Cache


JVM不同实现

Hotspot JVM

原先 SUN 公司开发, 现为 Oracle JDK 中默认JVM

OpenJ9

IBM主导开发, 捐赠给Eclipse基金会

Officail Site | IBM原文 | 技术文档

参考: IBM开源JVM实现OpenJ9,并提交Eclipse基金会托管) 参考: Eclipse Open J9:Eclipse OMR项目提供的开源JVM


GraalVM

Official Site

Doc

  • 安装 graalvm sdk install java 17.0.11-graal
  • 跟随样例中执行 native-image HelloWorld, 可以发现会占满16核CPUAMD 3700x和1G左右内存,20s才可以编译完成

Accelerating Java performance基准测试宣称快于openjdk8和11 1.55倍 GraalVM Native Image Support

GraalVM是一种AOT编译器,需要单独对特定平台(Windows,Linux,macOS)编译出产物

在 GraalVM 中,我们无法使用一些 Java 功能,如在运行时加载任意类。此外,许多可观察性和测试框架都不支持 GraalVM,因为它不允许在运行时生成动态代码,也无法运行 Java 代理。


参考: Oracle 发布多语种虚拟机平台 GraalVM 1.0
参考: 全栈虚拟机GraalVM初体验

Extend

CRaC

OpenJDK Wiki
Checkpoint and Restore With the JVM :: Spring Boot

JVM Checkpoint Restore :: Spring Framework
因为其实现的原理,可预见的要处理很多和时间有关的业务问题,例如调度。并且无法实现GraalVM那样的AOT实现对字节码的完全预热,只能快进到Bean准备就绪的状态,也就是省去了进程创建到Bean容器可用的时间。目前来看投入产出比很低,没有实践意义。