Je viens de commencer à recevoir un avertissement Nagios de notre serveur de construction, indiquant que le nombre de processus a dépassé la limite. En regardant nos graphiques Munin, je peux voir que le nombre de processus a augmenté régulièrement de 280 en décembre à la valeur actuelle de 430.
Je me demande comment je peux m'y prendre pour identifier les causes de l'augmentation du nombre de processus, afin de pouvoir redémarrer les services ou ajuster leur configuration si nécessaire.
Détails du serveur : CentOS 5.1, les principales choses qui fonctionnent sont notre serveur de construction Hudson qui tourne sous Tomcat, et un serveur Apache httpd qui est principalement juste un proxy pour Hudson. J'ai essayé de redémarrer httpd et Tomcat, mais le nombre de processus est resté le même. "top" indique que seul un des processus est actif ; les autres sont en sommeil.