现象:
某NAS存储,作为NFS 共享,给Linux主机,一日,业务反馈,df -h 卡住,刷不出来回显,umount也umount不掉,但重启后,df -h 恢复正常,需要配合排查一下是否是NAS存储的问题。
处理思路:
1、strace 跟踪日志如下:
发现到了NAS所挂载的地方,卡住了,进行不下去了。
2、查看是否使用了Hard参数,Hard参数会无限制去访问共享,而网络不通就会导致像卡死
nfsstat -m
发现有,但是网络是通的,telenet各个端口。
2、查看操作系统版本及内核,尤其内核
OS:Red hat 7.6
内核:3.10.0-957.e17
2、通过各方排查,查找Linux官网,发现有这么一个说法
https://access.redhat.com/solutions/3742871
大概意思就是说,3.10.0-957.e17内核的Red Hat,Centos等,有一个bug,这个内核情况下,在遇到网络抖动或者其它问题,会概率性导致df -h卡住,需要升级内核解决。
解决办法:
升级Linux内核。
-收工-