为什么在容器中1号进程挂不上arthas?
本文是《容器中的Java》系列文章之 4/n ,欢迎关注后续连载 :) 。
- JVM如何获取当前容器的资源限制?——容器中的Java 1
- Java Agent踩坑之appendToSystemClassLoaderSearch问题——容器中的Java 2
- 让 Java Agent 在 Dragonwell 上更好用——容器中的Java 3
最近在容器环境中,发现在Java进程是1号进程的情况下,无法使用arthas,提示AttachNotSupportedException: Unable to get pid of LinuxThreads manager thread
。具体操作和报错如下:
1 | java -jar arthas-boot.jar |
之前也遇到过,总是调整了下镜像,让Java进程不是1号进程就可以了。但这个不是长久之计,还是要抽时间看下这个问题。
复现问题
我们创建如下项目,来复现这个问题:
1 | public class Main { |
1 | FROM openjdk:8u212-jdk-alpine |
然后正常启动应用,并尝试用arthas,或者jstack:
1 | # 构建镜像 |
成功复现问题!接下来开始分析。
正常的attach流程是什么样子的?
如下是在排查问题中,梳理出来的jvm Attach流程:
- 查找
/tmp/.java_pid${pid}
这个unix socket,如果存在则检查权限,然后建立连接。 - 如果不存在,则先创建
/proc/${pid}/cwd/.attach_pid${pid}
,开始通知jvm线程。 - 首先判断是不是LinuxThread,如果是LinuxThread,则找到LinuxThreadsManager,然后给其所有子进程发送
SIGQUIT
. - 如果不是LinuxThread,则直接给目标进程发送
SIGQUIT
。 - 目标进程收到信号后,创建
Attach Listener
,监听/tmp/.java_pid${pid}
。 - 开始正常的socket通信,根据通信的具体内容,可以是dumpThread(jstack),也可以是加载JavaAgent,比如上面提到的arthas。
Java Attach机制之Native篇也是一个不错的attach API解析。
为什么对1号进程attach会报错?
首先,/tmp/.java_pid${pid}
当时是肯定不存在的,如果存在就是直接通信加载Arthas了。也可以通过查看文件来确认这一点。
其次,.attach_pid${pid}
文件也是能够创建成功的,我们也可以通过strace输出来确认:open("/proc/424/cwd/.attach_pid424", O_RDWR|O_CREAT|O_EXCL|O_LARGEFILE, 0666 <unfinished ...>
。
最有可能的原因就是线程判断、发送信号这一步了,我们以jstack为例查找为什么attach会失败。
本来类似上一次的查找过程,想着通过调试符号来查,但是在alpine上的调试符号无法显示源码内容,编译环境又很麻烦。所以还是优先用strace来查,值得注意的是,jstack的逻辑中有fork,所以记得使用strace -f jstack 1
来查。
查了下strace的输出,没有kill请求。看来问题是处在线程模型判定的。
刚刚提到jvm会判断是不是LinuxThread,那么什么是LinuxThread呢?首先看下判断的源码:
通俗的讲,Linux内核刚开始是不支持“线程”的,LinuxThread机制就是通过fork机制+共享内存空间的方式来实现线程。但LinuxThread在内核看来就是一些独立的父子进程,在信号处理、同步原语上有很多缺陷,要通过manager thread来处理这些逻辑。后来Red Hat发起NPTL,内核开始支持线程能力,也能够通过更加标准的方式来处理信号、同步等逻辑。
可以用getconf GNU_LIBPTHREAD_VERSION
来查看是哪种线程模型,比如我的机器上输出是NPTL 2.34
。当然,如上面代码所写,可以用confstr(_CS_GNU_LIBPTHREAD_VERSION,)
来获取当前的线程模型,详情参考手册。
- 如果
confstr(_CS_GNU_LIBPTHREAD_VERSION,)
返回0,则表示是glibc旧版本,认为是LinuxThread:先找到manager thread(通过查找父进程),然后给各个子进程发送SIGQUIT信号(这个过程需要遍历系统内所有进程)。 - 如果
confstr(_CS_GNU_LIBPTHREAD_VERSION,)
结果包含NPTL,则认为不是LinuxThread,按照NPTL来处理:直接发送SIGQUIT。
但是很可惜,LinuxThread/confstr(_CS_GNU_LIBPTHREAD_VERSION,)
不是POSIX标准,所以Alpine自带的musl对这个调用返回0。按照上面逻辑,jvm会认为是LinuxThread,尝试找到父进程,如果pid是1的话,自然找不到父进程,所以报错 Unable to get pid of LinuxThreads manager thread
,导致文章最开始说的arthas无法使用。
关于两种线程模型的详细比较,可以参考Linux 线程模型比较:LinuxThreads 和 NPTL。
为什么非1号进程就能attach?
模拟了下先手动进入shell(这时sh就是1号进程),然后再手动执行java Main
(pid为8),然后我们看下getLinuxThreadsManager是怎么表现的:
可以看到,在这种情况下,jvm认为manager thread是1号进程。此时会后执行sendQuitToChildrenOf(mpid)
:
即遍历所有的子进程,都发送SIGQUIT,这个逻辑其实是有点奇怪的。“超凡的主张,需要有超凡的证据”。我们重新跑一遍,用strace -f
验证一下。
进程树(其中绿色的是线程):
jstack发送的kill信号,可以看到jstack给1号进程的所有子进程发送了SIGQUIT:
这个行为和刚刚分析是一致的。不过非常巧合的是,大部分进程是忽略了SIGQUIT信号的,所以在这种情况下,jstack反而是正常工作了的。
怎么解决这个问题?
超短期workaround
这种方式不需要调整容器参数,不需要重启容器,比较推荐。
既然attach主要卡在了发送信号上,那我们就用shell来模拟这个流程:
1 | pid=1 ;\ |
通过上面的操作后,Attach Listener已经启动并且监听了路径,第二次attach就直接可以连接了;就可以按照正常的方式使用arthas了。
其中有一点需要注意,一定需要提前创建.attach_pid${pid}
文件,不然jvm会将这个信号交给默认的sigaction处理,对于pid 1来说,会导致容器退出!
也有人基于类似原理,做了一个jattach工具,可以直接在Alpine中,通过apk add jattach
来安装,然后jattach ${pid} properties
,也能起到一样的效果。
设置启动参数
这种方式需要调整启动参数或者环境变量,需要重启应用/容器,可能会丢失业务现场。
Jvm支持设置-XX:+StartAttachListener
,这样就能在启动Jvm的时候,自动启动Attach Listener线程并监听,也可以正常使用arthas。
对于容器环境下,更加容易的做法是给容器添加环境变量JAVA_TOOL_OPTIONS=-XX:+StartAttachListener
,这样不用修改启动脚本也能达到效果。
上游优先,修改镜像
这种方式需要修改镜像
OpenJDK 8官方没有修复这个问题,所以如果直接使用openjdk:8-jdk-alpine
,是避免不了这个问题的。Docker镜像仓库也有人讨论这个问题。
OpenJDK 11就已经解决了这个问题了(见源码),不再对古旧的LinuxThread模型做判断,这样arthas也能工作。
不过Alpine官方仓库中的OpenJDK 8已经通过自己打patch的方式,修复了这个问题https://gitlab.alpinelinux.org/alpine/aports/-/issues/13032。
作为比较知名的JDK发行版,也在eclipse-temurin:8-jdk-alpine
中修复了这个问题,可以直接使用这个镜像,相关讨论见https://github.com/adoptium/jdk8u/pull/8。
总结
在arthas 的 issue 中,或者网上相关的文章中,总是重复着Java不能作为1号进程。很多时候,就因为如此,我们没有办法挂上诊断工具,导致现场丢失,故障原因不能及时定位。
作为技术人员还是需要了解底层,这样在排查问题、架构设计上才会有更多自由度,更能够抓住问题、解决问题。
后续还会出系列文章,来解决容器环境下奇奇怪怪的jvm问题,欢迎关注!
为什么在容器中1号进程挂不上arthas?