Notre projet utilise Ganglia pour nos clusters de plus de 100 nœuds. L'une des raisons pour lesquelles nous l'utilisons est qu'il s'agit de l'outil de surveillance fourni avec le système de gestion de la qualité. Roches .
Il est important pour nous d'avoir une très faible surcharge sur chaque nœud afin qu'un maximum de ressources soient disponibles pour le calcul. Ganglia nous donne une bonne vue d'ensemble du cluster et nous permet de descendre jusqu'aux nœuds individuels si nécessaire. En plus de savoir ce qui se passe en ce moment, nous pouvons avoir un bon aperçu de ce qui s'est passé au cours de l'heure, du jour, de la semaine, du mois et de l'année derniers. Les graphiques des différentes statistiques sont basiques et fonctionnels.
0 votes
Quelle est la plate-forme utilisée par votre serveur ?
1 votes
Mes serveurs fonctionnent sous Debian Lenny, mais la question n'est pas principalement axée sur la surveillance UNIX seule, car de nombreux outils auront probablement une forme de support multiplateforme.
0 votes
Ils utilisent peut-être des outils différents, mais du point de vue du système global, vous finissez par faire la même chose encore et encore sur les différents systèmes. C'est juste un peu de script pour extraire la dernière partie des données que vous voulez. Dans ce contexte, je considère que les "outils" sont l'instance d'enregistrement (serveur de surveillance) et non le plugin/script qui extrait les données.
0 votes
J'aime aussi surveiller les applications (performances, disponibilité, etc.). Les outils de surveillance semblent avoir un spectre avec leur capacité à surveiller le matériel d'un côté et leur capacité à surveiller les applications de l'autre. Hardware<-----+----->Application