linux too many open files 文件句柄数限制解决


在Linux下面部署应用的时候,有时候会遇上Socket/File: Can’t open so many files的问题,其实Linux是有文件句柄限制的,而且默认不是很高,一般都是1024,作为一台生产服务器,其实很容易就达到这个数量,因此我们需要把这个值改大一些。

我们可以用ulimit -a来查看所有限制值,现在只关心文件句柄数量的问题:
open files (-n) 1024
这个就是限制数量
这个1024是是用户限制,是当前用户准备要运行的程序的限制。
1、这个限制是针对单个程序的限制
2、这个限制不会改变之前已经运行了的程序的限制
3、对这个值的修改,退出了当前的shell就会消失

比如说,我先运行了一个程序A,然后通过ulimit修改了限制为2048,然后运行B,然后退出了shell再登录,然后运行C。那就只有B可以打开2048个句柄。

==ulimit限制仅对shell有效==

==对与后台deamon进程的打开文件数限制需要修改系统的max-file==

cat /proc/sys/fs/file-max     #查看
echo "fs.file-max = 655360" >>/etc/sysctl.conf ;sysctl -p

如果我们需要改变整体的限制值,或者我们运行的程序是系统启动的,应该怎么处理呢?其中一个方法,是想ulimit修改命令放入/etc/profile里面,增加 ulimit -SHn 999999 但是这个做法并不好(非root用户执行失败)

==增加 ulimit正确的做法,应该是:vi /etc/security/limits.conf==

*      soft    nproc   1048576
*      hard    nproc   1048576
*       soft    nofile  1048576
*       hard    nofile  1048576
root    soft    nofile  1048576
root    hard    nofile  1048576
root   soft    nproc   1048576
root   hard    nproc   1048576

#修改limits.conf要使得root生效需要单独写root行.

#修改 max user processes limits
ulimit -u 检查
/etc/security/limits.d/90-nproc.conf
*          soft    nproc     65535
root       soft    nproc     unlimited

for centos5
vi /etc/security/limits.conf
* soft nproc 65535
* hard nproc 65535
动态调整:
echo -n 'Max processes=SOFT_LIMITS:HARD_LIMITS' > /proc/`pid of mysqld`/limits

异常处理

==针对mysql max_connections特殊处理:==

vi /usr/lib/systemd/system/mysqld.service 
LimitNOFILE=65535

==如果修改失败,可能影响的地方:==

vi /etc/pam.d/login
session    required   pam_limits.so

==ulimit -n 65536 报错无权限==

vi /etc/ssh/sshd_config
UseLogin yes
service sshd restart

说明

ulimit其实就是对单一程序的限制
* soft nofile 2048
* hard nofile 32768
就可以将文件句柄限制统一改成软2048,硬32768
这里涉及另外一个问题,什么是软限制,什么是硬限制
硬限制是实际的限制,而软限制,是warnning限制,只会做出warning
其实ulimit命令本身就有分软硬设置,加-H就是硬,加-S就是软
默认显示的是软限制,如果修改的时候没有加上的话,就是两个一起改
配置文件最前面的一位是domain,设置为星号代表全局,另外你也可以针对不同的用户做出不同的限制
修改了,重新登录用ulimit一开就立刻生效了,不过之前启动过的程序要重新启动才能使用新的值。我用的是CentOS,似乎有些系统需要重启才能生效。

查看文件描述符数

#系统总限制
/proc/sys/fs/file-max

#整个系统目前使用的文件句柄数量
/proc/sys/fs/file-nr
查找文件句柄问题的时候,还有一个很实用的程序lsof
lsof -p PID
可以很方便看到某个进程开了那些句柄
也可以看到某个文件/目录被什么进程占用了(umount不了就可以看谁的问题了)

#强制结束所有某个目录下运行的程序
fuser -k -m -v /u03
umount /u03

查看进程打开文件句柄数

lsof -n|awk '{print $2}'|sort|uniq -c |sort -nr|more
lsof -p pid|wc -l
ls /proc/pid/fd/|wc -l