Bien qu'il s'agisse d'un ancien message, je réponds maintenant car je sais que les valeurs de seuil de check_load sont un véritable casse-tête pour les débutants ;)
Une alerte, si le CPU est à 70% pendant 5 minutes, 60% pendant 10 minutes, 50% pendant 15 minutes. Une alerte critique, si le CPU est à 90% pendant 5 minutes, 80% pendant 10 minutes, 70% pendant 15 minutes.
*command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7*
Toutes mes conclusions sur la charge du processeur :
Qu'entend-on par "la charge" ? Wikipedia dit :
Tous les systèmes Unix et Unix-like génèrent une métrique de trois nombres "moyenne de charge" dans le noyau. Les utilisateurs peuvent facilement demander le résultat actuel à partir d'un Shell Unix en exécutant la commande uptime :
$ uptime
14:34:03 up 10:43, 4 users, load average: 0.06, 0.11, 0.09
A partir de la moyenne de la charge de sortie ci-dessus : 0.06, 0.11, 0.09
signifie (sur un système à une seule unité centrale) :
- au cours de la dernière minute, l'unité centrale a été sous-chargée de 6 %.
- au cours des 5 dernières minutes, le CPU a été sous-chargé de 11 %.
- au cours des 15 dernières minutes, l'unité centrale a été sous-utilisée à 9 %.
.
$ uptime
14:34:03 up 10:43, 4 users, load average: 1.73, 0.50, 7.98
La moyenne de charge ci-dessus de 1.73 0.50 7.98
sur un système à une seule unité centrale :
- au cours de la dernière minute, l'unité centrale a été surchargée de 73 % (1 unité centrale avec 1,73 processus exécutables, de sorte que 0,73 processus ont dû attendre leur tour)
- au cours des 5 dernières minutes, le CPU a été sous-chargé de 50 % (aucun processus n'a dû attendre son tour)
- au cours des 15 dernières minutes, le CPU a été surchargé à 698 % (1 CPU avec 7,98 processus exécutables, de sorte que 6,98 processus ont dû attendre leur tour)
Calcul de la valeur seuil de Nagios :
Pour la configuration de la charge CPU de Nagios, qui comprend l'avertissement et le critique :
y = c * p / 100
W y = nagios value
c = number of cores
p = wanted load procent
pour un système à 4 cœurs :
time 5 min 10 min 15 min
warning: 90% 70% 50%
critical: 100% 80% 60%
command[check_load]=/usr/local/nagios/libexec/check_load -w 3.6,2.8,2.0 -c 4.0,3.2,2.4
Pour un système à noyau unique :
y = p / 100
W y = nagios value
p = wanted load procent
time 5 min 10 min 15 min
warning: 70% 60% 50%
critical: 90% 80% 70%
command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7
Un excellent livre blanc sur l'analyse de la charge du processeur par le Dr Gunther http://www.teamquest.com/pdfs/whitepaper/ldavg1.pdf Dans cet article en ligne, le Dr Gunther se plonge dans le noyau UNIX pour découvrir comment les moyennes de charge (les "LA Triplets") sont calculées et comment elles sont appliquées. moyennes de charge (les "LA Triplets") sont calculées et dans quelle mesure elles sont appropriées pour la de planification de la capacité.