linux内核打开文件句柄数量以及日志报错Nov 29 00:51:02 localhost kernel: VFS: file-max limit 65535 reached解决办法

【linux命令】linux内核打开文件句柄数量以及日志报错Nov 29 00:51:02 localhost kernel: VFS: file-max limit 65535 reached解决办法

出现这个报错,意思是指当前系统的文件句柄数量已经超出了系统级文件句柄数量file-max设置,目前解决办法是调整这个系统级文件句柄数量的参数,或者排查异常进程处理。

1,查看linux内核下打开进程级文件句柄数量参数以及更改参数:
[[email protected] ~]$ulimit -n
1024
这个值明显是过小,系统部署的某个服务如打开文件数量稍大,那么就非常容易报错。内核更改办法如下:
临时解决办法:
ulimit -n 65535

永久解决办法:
vim /etc/security/limits.conf

* soft nofile 65536
* hard nofile 65536

* soft memlock unlimited
* hard memlock unlimited

* soft nproc 2048

当然这个值也可以设置更大。同时也要注意修改 /etc/security/limits.d/90-nproc.conf设置的参数

2,查看系统级级文件句柄数量file-max。
这个文件是要设置/etc/sysctl.conf 配置文件,参数一般如下:
fs.file-max = 65535
已经设置65535,系统也有可能报错。这个就要查具体报错了。
我们可以通过如下命令观察文件句柄数量打开情况:
watch -n 1 cat /proc/sys/fs/file-nr
正常情况:

出现上述不正常情况,基本服务器的各个服务器都挂了或者不能正常使用,肯定是某个服务把他打开完毕了。 我们可以通过如下命令查看大体情况:

lsof -n|awk '{print $2}'|sort|uniq -c|sort -nr|more

结果如下:

[[email protected] ~]#  lsof -n|awk '{print $2}'|sort|uniq -c|sort -nr|more
    489 25234
    180 1270
    168 1284
    168 1283
    168 1282
    168 1278
    168 1277
    113 1291
    109 1417

说明:第一列是打开文件句柄数,第二列是PID
可以根据pid查看相似的进程大概是哪些,pid值都相近的。然后找到其中一个pid,cd /proc/pid查看是打开的哪个应用,这样就方便我们定位问题了 。
比如我这里就是的问题是之前ssh隧道映射导致大量的sshd进程影响的,处理办法就是如下:
到内网映射机器执行如下操作:

ps aux | grep sshtunel.sh | awk '{print $2}' |xargs kill

将其杀掉以后。重启线上服务器恢复。

hmoban主题是根据ripro二开的主题,极致后台体验,无插件,集成会员系统
自学咖网 » linux内核打开文件句柄数量以及日志报错Nov 29 00:51:02 localhost kernel: VFS: file-max limit 65535 reached解决办法