JVM
Contents
💠
-
- 1.1. JVM参数
- 1.2. JVM内存参数
- 1.3. Unified JVM Logging
-
- 2.1. 堆内存管理
- 2.2. 非堆内存管理 glibc
-
- 3.1. 运行时数据区
- 3.2. Native Memory 非堆内存
- 3.2.1. NMT Native Memory Tracking
- 3.2.2. Metaspace 元空间
- 3.2.3. DirectMemory 堆外内存
- 3.2.4. Code Cache
-
- 4.1. Hotspot JVM
- 4.2. OpenJ9
- 4.3. GraalVM
-
- 5.1. CRaC
💠 2024-12-24 10:16:38
JVM
JVM结构及设计
Oracle JDK 默认采用的是 Hotspot JVM
书籍
- 《深入理解 Java 虚拟机》(周志明 第二版) 大部分内容来源于此, 但是部分内容是依据Java8有所改动
社区
JVM参数
Command Reference for JDK8 | Command Reference for JDK17
Official: Java HotSpot VM Options
Guide to the Most Important JVM Parameters
-
-Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=9999 -Dcom.sun.management.jmxremote.authenticate=false -Dcom.sun.management.jmxremote.ssl=false
- 开启无需认证 非SSL的JMX端口: 9999
-
-XX:+TraceClassLoading -XX:+TraceClassUnloading
输出类装载/卸载日志,可用于排查类从哪个jar加载进入JVM的- Java9及以后替代为:
-Xlog:class+load=info
- Java9及以后替代为:
OOM
-XX:+HeapDumpOnOutOfMemoryError
-XX:HeapDumpPath=./java_pid<pid>.hprof
注意路径需要存在,JVM不会创建不存在的目录-XX:OnOutOfMemoryError="< cmd args >;< cmd args >"
-XX:+UseGCOverheadLimit
字符串
- -XX:+UseStringCache
- -XX:+UseCompressedStrings
- -XX:+OptimizeStringConcat
- -XX:+UseStringDeduplication
编译类参数
- CICompilerCount是JIT进行热点编译的线程数,和并发标记线程数一样,热点编译也是CPU密集型任务,默认值为2。
在CICompilerCountPerCPU开启的时候(JDK7默认关闭,JDK8默认开启),手动指定CICompilerCount是不会生效的,JVM会使用系统CPU核数进行计算。
所以当使用JRE8并且版本小于1.8.0_131,采用默认参数时,CICompilerCount会在20左右,对业务性能影响较大,特别是启动阶段。建议升级Java版本,特殊情况要使用老版本Java 8,请加上
-XX:CICompilerCount=[n]
, 同时不能指定-XX:+CICompilerCountPerCPU ,下表给出了生产环境下常见规格的推荐值。
CPU核数 | 1 | 2 | 4 | 8 | 16 |
---|---|---|---|---|---|
推荐值 | 2 | 2 | 3 | 3 | 8 |
JVM内存参数
堆(老年代 年轻代),堆外,元空间,栈
内存参数设置的考量: Xmx * 110% + MaxDirectMemorySize + 系统预留内存 <= 容器内存
- Xmx * 110% 中额外的10%是留给其他堆外内存的,是个保守估计,个别业务运行时线程较多时,还需加上 Xss * 线程数
- 系统预留内存512M到1G,视容器规格而定
- I/O较多的业务适当提高MaxDirectMemorySize比例(Netty和NIO使用到)
快速确认进程内存配置
工具 | 命令 |
---|---|
Arthas | jvm |
OpenJDK | jcmd pid GC.heap_info |
OracleJDK | jmap -heap pid |
-XX:CompressedClassSpaceSize=500m
压缩的类元空间大小 默认是1g-XX:SurvivorRatio
配置 Edgen 和 单个Survivor 的比例, 如果配置为2 则是 2:1:1。 默认是8-XX:NewRatio
old/new 内存的比值 默认是2-Xmn
MaxNewSize 默认值是Xmx
的1/3 即最大堆内存 MaxHeapSize 的1/3-Xss
设置 ThreadStackSize 线程的栈内存大小 默认值 1024k-XX:+AlwaysPreTouch
堆内存分配时,直接分配物理内存而不是虚拟内存,分配的物理内存会做0值初始化(单线程执行),好处是后续申请内存时无须分配和初始化,缺点是启动更耗时。- 申请内存的场景(年轻代晋升,新对象分配)
java -XX:+PrintFlagsFinal -version
-XX:+PrintFlagsInitial
输出初始默认值-XX:+PrintFlagsFinal
输出JVM最终属性值- MaxHeapSize 最大堆内存
- MaxRAMFraction 默认最大内存占物理机内存的比例 JDK6,7,8 都是4 即1/4
- NUMA 机制
java -XX:+PrintFlagsFinal -version | grep "Use.*GC"
查看默认GC实现
-XshowSettings:VM
展示VM和系统信息
需要理解,但是不用,尽量使用明确的 Xmx Xms
JVM Parameters InitialRAMPercentage, MinRAMPercentage, and MaxRAMPercentage
- MinRAMPercentage, MaxRAMPercentage 其实都是设置堆默认最大值的, Max 和 Min 换成 Big Small可能更好理解(大内存环境和小内存环境
200M划分
) -XX:InitialRAMPercentage
初始堆使用值 默认1.5625, 当配置了-Xms
时,该配置将被忽略- InitialRAMFraction MaxRAMFraction MinRAMFraction DefaultMaxRAMFraction 4等分值
容器内的JVM
容器无法感知资源限制, 8U191/10b34 及以上版本才支持
- 快速实验某个Java版本的默认参数和限制 docker run -m 100MB openjdk:8 java -XX:MinRAMPercentage=80.0 -XshowSettings:VM -version
- 参考: Java和Docker限制的那些事儿
天坑: 低版本的Jvm无法感知到Docker的资源限制
- 但是有的Linux版本在后续的版本也无法感知,例如 1.8.0_342 10.0.2 仍取的主机内存, Linux 5.15内核 Manjaro23.1
- Java (prior to JDK8 update 131) applications running in docker container CPU / Memory issues?
- Best Practices: Java Memory Arguments for Containers
总结: 尽量使用 Xms Xmx,而不是 RAMPercentage RAMFractionc参数(还要结合容器或宿主机计算实际值),降低维护和理解成本,控制更灵活精确,且支持所有版本JVM,不用考虑兼容性问题
参数:
- -XX:ActiveProcessorCount=$CONTAINER_CORE_LIMIT 强制设置CPU量 从downawrd_api获取
- -Xlog:os+container=logLevel JVM报告容器信息
- -XX:-UseContainerSupport 关闭容器支持,默认开启
内存参数实践
初始和最大堆内存设置为一样的好处 Benefits of setting initial and maximum memory size to the same value
- 避免扩容的暂停事件,提前调度充足资源的容器防止运行期扩容而被Linux被OOMKiller杀掉
参考: JVM实用参数(一)JVM类型以及编译器模式
xxfoxJvm参数辅助工具
参考: JVM动态反优化
Unified JVM Logging
Java9开始,整合了GC,类加载等日志配置方式,日志级别,输出方式 正交式声明使用,更统一及灵活。
JVM 基本结构
- 类加载器子系统
- 负责从文件系统或者网络中记载Class信息,加载的类信息存放于一块称为方法区的内存空间。除了类的信息外,方法区中可能还会存放运行时的常量池信息,包含字符串字面量和数字常量(这部分常量信息是Class文件中常量池部分的内存映射)
- Java堆
- 在虚拟机启动的时候建立,他是Java程序最主要的内存工作区域。几乎所有Java对象实例都存放于Java堆中。堆空间是所有线程共享的,这是一块与Java应用密切相关的内存区间
- Java的NIO库允许Java程序使用直接内存。直接内存是Java堆外的、直接向系统申请的内存区间。通常,访问直接内存的速度优于Java堆。因此出于性能考虑,读写频繁的场合可能会考虑使用直接内存。由于直接内存在Java堆外,因此他的大小不会直接受限于Xmx指定的最大堆大小,但是系统内存是有限的,Java堆和直接内存的总和依然受限于操作系统能给出的最大内存
- 垃圾回收系统
- 是Java虚拟机的重要组成部分,垃圾回收器可以对方法区、Java堆和直接内存进行回收。其中,Java堆是垃圾回收器的工作重点。和C/C++不同,Java中所有的对象空间释放都是隐式的。也就是说,Java中没有类似free()和delete()这样的函数释放指定的内存区域,对于不再使用的垃圾对象,垃圾回收系统会在后台默默工作,默默查找、标识并释放垃圾对象,完成Java堆、方法区和直接内存中的全自动管理。
- Java虚拟机栈
- 每一个Java虚拟机线程都有一个私有的Java栈。一个线程的Java栈在线程创建的时候被创建。Java栈中保存着帧信息,Java栈中保存着局部变量、方法参数,同时和Java方法的调用、返回密切相关。
- 本地方法栈
- 和Java栈非常类似,最大的不同在于Java栈用于Java方法的调用,而本地方法栈则用于本地方法调用。作为Java虚拟机的重要扩展,Java虚拟机允许Java直接调用本地方法。
- PC寄存器
- 也是每个线程私有的空间,Java虚拟机会为每一个Java线程创建PC寄存器。在任意时刻,一个Java线程总是在执行一个方法,这个正在被执行的方法称为当前方法。如果当前方法不是一个本地方法,PC寄存器就会指向当前正在被执行的指令。如果当前方法是本地方法,那么PC寄存器的值就是undefined。
- 执行引擎
- 是Java虚拟机的最核心组件之一,它负责执行虚拟机的字节码。
堆内存管理
非堆内存管理 glibc
注意JVM所有内存的申请和返还都是通过 glibc 实现的,因此不建议使用Alpine作为基础镜像,因为会有行为上的不一致,Alpine使用的是 musl libc(核心源码只有不到 400 行)。
从一次 CTF 出题谈 musl libc 堆漏洞利用本文通过一道 CTF 题目展示 musl libc 堆溢出漏洞的利 - 掘金
但是glibc在高并发场景下也有缺点: How glibc Memory Handling Affects Java Applications: The Hidden Cost of Fragmentation
在高并发请求的应用系统上,会有大量对象创建和销毁,堆内的内存管理有GC,但是非堆的内存,例如 DirectMemory 等等会因为glibc的设计出现内存碎片,内存延迟返还操作系统的情况
优化方案:
- 将 glibc 替换为 jemalloc
java -Djava.library.path=/path/to/jemalloc -jar YourApplication.jar
- 限制 glibc 的内存池
export MALLOC_ARENA_MAX=2
环境变量- MALLOC_ARENA_MAX=1 与 MALLOC_ARENA_MAX=4有什么区别? | easyice
- 该设计是为了在高并发的场景申请内存时直接从Arena内存申请,而不需要再通过 mmap sbrk等系统调用,并且为了降低多线程申请时的竞争,会最多创建cpucore*8个Arena,此类可以称为 thread arena ,进程只有一个 main arena 作为兜底空间
- thread arena 的内存需要等待 才会释放,本质上是系统内有长生命周期的对象存在导致
- 优化系统代码,减少非堆内存使用场景。
内存区域
Java 进程内存占用及可观测性调研&内存异常排查最佳实践
深入探究内存分布细节
谈JVM xmx, xms等内存相关参数合理性设置
运行时数据区
线程私有的内存区域: 程序计数器 本地方法栈 虚拟机栈. 生命周期与线程保持一致
程序计数器
可以看作是当前线程所执行的字节码的行号指示器, 这个内存区域是唯一一个在JVM规范中没有规定任何 OutOfMemoryError 的区域
Java虚拟机栈
HotSpot 中不区分Java虚拟机栈和本地方法栈, 虽然 -Xoss 存在(设置本地方法栈大小)但是是无效的, 只能通过 -Xss 设置 且可以通过NMT看到所有线程数及占用的非堆内存
-
虚拟机栈描述的是Java方法执行的内存模型: 每个方法在执行的同时, 都会创建一个
栈帧
(Stack Frame)- 用于存储局部变量表, 操作数栈, 动态链接, 方法出口等信息
- 在一个栈帧中,至少要包含局部变量表、操作数栈和帧数据。
-
每个方法调用到执行完成的过程, 就对应着一个栈帧在虚拟机栈中入栈到出栈的过程
-
局部变量表
- 存放了编译期可知的各种 基本数据类型, 对象引用, returnAddress 类型
- 对象引用: reference 类型, 不等同于对象本身, 可能是一个指向对象地址的引用指针, 可能是一个代表对象的句柄, (可能是其他与此对象相关的位置?)
- returnAddress: 指向了一条字节码指令的地址
- 只有 long double 类型 会占用 2 个局部变量空间, 其他类型都只占用 1 个
- 局部变量表所需的内存空间在编译后就已经确定下来, 运行期是不会变的
- 存放了编译期可知的各种 基本数据类型, 对象引用, returnAddress 类型
-
Java虚拟机规范中对该内存区域定义了两种异常状况
- 如果线程请求的栈深度大于虚拟机所允许的最大深度, 将抛出 StackOverFlowError
- 如果虚拟机在扩展栈时, 无法申请到足够的内存, 则抛出 OutOfMemoryError 异常
本地方法栈
Native Method Stack, 与虚拟机栈所发挥的作用是相似的, 只不过虚拟机栈是为虚拟机执行Java方法服务, 本地方法栈是为了虚拟机使用 Native 方法服务
Heap 堆
Java虚拟机规范中的描述是 所有对象实例以及数组都是在堆上分配, 但是由于 JIT编译器 逃逸分析 栈上分配, 标量替换等技术, 就变得没那么绝对了
堆分为 新生代(包含: Eden, Survivor from, Survivor to) 老年代
从堆和栈的功能和作用来通俗的比较,堆主要用来存放对象的,栈主要是用来执行程序的.
JVM是基于堆栈的虚拟机.JVM为每个新创建的线程都分配一个堆栈.也就是说,对于一个Java程序来说,它的运行就是通过对堆栈的操作来完成的。
堆栈以栈帧为单位保存线程的状态。JVM对堆栈只进行两种操作:以帧为单位的压栈和出栈操作。
堆内存分配策略
- 对象的内存分配, 粗略讲就是在堆上分配(但也可能经过JIT编译后被拆散成标量类型并间接地栈上分配)
- 对象主要分配在Eden; 如果启动了本地线程分配缓冲, 则优先在TLAB上分配; 也有直接分配在老年代的 (长字符串以及数组)
类变量
(static修饰的变量) 在程序加载时系统就为它在堆中开辟了内存,堆中的内存地址存放于栈以便于高速访问。- 生命周期: 从应用进程启动一直到进程停止
实例变量
当你使用java关键字new的时候,系统在堆中开辟并不一定是连续的空间分配给变量(比如说类实例),然后根据零散的堆内存地址,通过哈希算法换算为一长串数字以表征这个变量在堆中的"物理位置"。- 生命周期: 当实例变量的引用丢失后,将被GC(垃圾回收器)列入可回收“名单”中,但并不是马上就释放堆中内存
局部变量
局部变量,由声明在某方法,或某代码段里(比如for循环),执行到它的时候在栈中开辟内存- 生命周期: 当局部变量一但脱离作用域,内存立即释放
- 如果对象在 Eden 出生, 并经过一次 MinorGC后存活, 并能被 Survivor 容纳, 将被移入 Survivor 且年龄为1.
- 对象在 Survivor 每经过一次 MinorGC 年龄加1, 当达到 MaxTenuringThreshold(默认15) 就会移入老年代
- 如果 Survivor 空间中相同年龄所有对象大小的总和大于 Survivor 空间的一半, 年龄大于等于该年龄的对象都将进入老年代, 无需等到设置的 MaxTenuringThreshold
堆内存配置: 新生代一般设置为整个堆空间的1/3到1/4左右最合适。
新生代内存不能过大也不能过小, 过大则老年代内存过小, 导致频繁 FullGC
过小则导致对象全在老年代分配,新生代上无法分配(Allocation Failure) 也将导致频繁 Full GC
方法区 Java7
方法区存在于永久代 Perm Gen, 对应于Java8中的MetaSpace
用于存放 Class 相关信息, 常量, 静态变量, 访问修饰符, 字段描述, 方法描述, JIT编译器编译后的代码等数据
在 HotSpot 虚拟机上, 方法区也看做是 永久代 Permanent Gen, 两者关系是: 方法区是Java虚拟机规范, 永久代是方法区在Hotspot上的实现
从Java8开始, 永久代已经被 MetaSpace(操作系统的直接内存) 取代
JDK7中符号表被移动到 Native Heap中,字符串常量池和类引用被移动到 Java Heap中。
运行时常量池是方法区的一部分, 用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池存放.
Native Memory 非堆内存
Native Memory 主要是JNI、线程栈、编译器、符号表、Deflater/Inflater、DirectByteBuffer(nio中会用到)使用的
当发现Java进程的堆使用率不高,但是进程占用内存RSS很高,就要怀疑这块区域了, 可以先通过NMT工具对每个区域进行分析,进一步可以对进程内存进行分析(pmap等工具)
参考: 聊聊JVM 堆外内存泄露的BUG是如何查找的
JAVA堆外内存排查小结
Java in K8s: how we’ve reduced memory usage without changing any code
还有两种内存 Native Memory Tracking 没有记录,那就是:
- MMap Buffer:文件映射内存
- JNI 方法里的内存分配
NMT Native Memory Tracking
NMT Memory Categories
内存各分类说明
- 启用NMT: java -XX:NativeMemoryTracking=summary 或 detail (开销更大一些)
- 查看NMT: jcmd $pid VM.native_memory
[detail] 对应启用时设置,输出具体内存地址信息
- summary 缺省参数,查看概览
- detail detail模式才支持,查看内存地址明细
- baseline 设置当前时刻为基线
- summary.diff 对比前文设置的基线的变化值
- detail.diff detail模式对比前文设置的基线的变化值
- shutdown 停止 Tracking
- scale 设置展示的单位值默认KB (MB or GB)
- statistics detail模式输出统计信息
示例
|
|
Metaspace 元空间
MetaSpace Java8 引入, 取代了以往的 Perm Gen
- 存放内容:
- Klass结构
- 匿名类, Lambda表达式
- String.intern 的字符串
特性
- 充分利用了Java语言规范:类及相关的元数据的生命周期与类加载器的一致。
- 每个类加载器都有它的内存区域-元空间
- 只进行线性分配
- 不会单独回收某个类(除了重定义类 RedefineClasses 或类加载失败)
- 没有GC扫描或压缩
- 元空间里的对象不会被转移
- 如果GC发现某个类加载器不再存活,会对整个元空间进行集体回收
参考: Metaspace Architecture
参考: What is Compressed Class Space?
深入理解堆外内存 Metaspace
-XX:MaxMetaspaceSize 指定元空间的最大空间,默认值是无限(16EB) -XX:MetaspaceSize 指定元空间首次扩充的大小,默认为20.75M
由于MaxMetaspaceSize未指定时,默认无上限,所以需要特别关注内存泄露的问题
如果程序动态的创建了很多类(反射,Lambda等等)或出现过java.lang.OutOfMemoryError:Metaspace, 建议明确指定-XX:MaxMetaspaceSize
Metaspace实际分配的大小是随着需要逐步扩大的,每次扩大需要执行一次FGC,-XX:MetaspaceSize默认的值是比较小的,需要频繁GC扩充到实际需要的大小。
类似日志可以看到Metaspace引起的FGC:[Full GC (Metadata GC Threshold) ...]
, 因此为减少预热影响,可以将-XX:MetaspaceSize,-XX:MaxMetaspaceSize指定成相同的值。
DirectMemory 堆外内存
常说的堆外内存都是指这块,即NIO使用到的缓冲区内存(直接操作系统申请,不受GC控制)。
通常出现在NMT监控中的 Internal 部分,如果发现这部分增长明显,需要排查NIO相关的代码使用和配置了。
-
-XX:MaxDirectMemorySize
限制最大内存- 该参数只能限制 DirectByteBuffer(Bits)申请内存的最大值,无法限制Unsafe申请内存
如果未手动指定值,通过jcmd工具查看的值为0,实际取值参考:
- 使用CMS,Parallel GC时默认值为: MaxHeapSize - Survivor
- 使用G1时最大默认是 MaxHeapSize
Code Cache
JVM不同实现
Hotspot JVM
原先 SUN 公司开发, 现为 Oracle JDK 中默认JVM
OpenJ9
IBM主导开发, 捐赠给Eclipse基金会
Officail Site | IBM原文 | 技术文档
参考: IBM开源JVM实现OpenJ9,并提交Eclipse基金会托管) 参考: Eclipse Open J9:Eclipse OMR项目提供的开源JVM
GraalVM
- 安装 graalvm
sdk install java 17.0.11-graal
- 跟随样例中执行 native-image HelloWorld, 可以发现会占满16核CPU
AMD 3700x
和1G左右内存,20s才可以编译完成
Accelerating Java performance
基准测试宣称快于openjdk8和11 1.55倍
GraalVM Native Image Support
GraalVM是一种AOT编译器,需要单独对特定平台(Windows,Linux,macOS)编译出产物
在 GraalVM 中,我们无法使用一些 Java 功能,如在运行时加载任意类。此外,许多可观察性和测试框架都不支持 GraalVM,因为它不允许在运行时生成动态代码,也无法运行 Java 代理。
Extend
CRaC
OpenJDK Wiki
Checkpoint and Restore With the JVM :: Spring Boot
JVM Checkpoint Restore :: Spring Framework
因为其实现的原理,可预见的要处理很多和时间有关的业务问题,例如调度。并且无法实现GraalVM那样的AOT实现对字节码的完全预热,只能快进到Bean准备就绪的状态,也就是省去了进程创建到Bean容器可用的时间。目前来看投入产出比很低,没有实践意义。
Author Kuangcp
LastMod 2019-04-02