Je cherche un moyen de diagnostiquer des problèmes, tels que la mort de swap, où un processus de mémoire de type ballon remplit le swap et met hors service toute la machine (comme apache).
J'utilise déjà cacti et je peux mettre en place nagios (bien que je préférerais ne pas le faire) ou munin mais autant que je puisse le dire, ils ne peuvent pas enregistrer l'utilisation individuelle des programmes - juste l'état général.
Je sais que je peux écrire un script qui >> vers un fichier toutes les 30 secondes mais j'aimerais voir si une solution mature existante existe déjà.
Encore une fois, idéalement, cela devrait :
- enregistrer l'utilisation de la mémoire des processus toutes les N secondes
- enregistrer l'utilisation du processeur des processus toutes les N secondes
- prendre en charge les graphiques et l'historique
- prendre en charge les moyennes - comme mysqld a utilisé 43% du processeur dans la dernière journée et une moyenne de 400Mo de mémoire
- être gratuit et open source
Les noms des processus ne sont pas connus à l'avance et ne devraient pas l'être - l'idée est simplement de le laisser surveiller et ensuite d'examiner les principaux coupables.
Mon système est Linux (OpenSUSE).