Disons que j'essaie de surveiller une boîte avec Nagios, mais qu'il y a un processus en fuite qui vole près de 100% du processeur et de la RAM de l'ordinateur. Comment Nagios continue-t-il de me alerter sur l'état de la boîte, dans ce cas ? Qu'empêche le processus en fuite de bloquer également l'exécution de Nagios?
Réponse
Trop de publicités?Si le serveur surveillé est surchargé, Nagios ou tout autre programme de surveillance est incapable de fonctionner sur ce serveur.
Mais ne vous inquiétez pas, vous recevrez vos alertes précieuses : vous reconnaîtrez la situation en constatant que chaque test Nagios surveillant le serveur prendra du temps.
Cependant, si vous avez tout, y compris Nagios, tournant sur le même serveur, alors votre Nagios est vulnérable à une mort soudaine. Ayez toujours un serveur de surveillance séparé ou la surveillance sera inutile : elle tombera au moment même où vous en auriez réellement besoin !
Vous devriez également envisager de mettre en place des moniteurs informatifs, tels que la charge moyenne. Faites en sorte que Nagios vous avertisse si la charge moyenne dépasse un certain point critique.
Le traçage de différents aspects du serveur tels que le CPU, la mémoire et l'utilisation du disque avec MRTG, Cacti ou Nagiosgraph est également utile et vous permet de surveiller les tendances plus facilement.