186 votes

Quel outil utilisez-vous pour surveiller vos serveurs ?

Pour une liste plus complète des outils de surveillance et de leurs fonctionnalités, consultez le site cette page Wikipedia .

Comme le dit la question, quels sont les outils les plus couramment utilisés pour cette tâche et quels sont leurs points forts et leurs points faibles ?

0 votes

Quelle est la plate-forme utilisée par votre serveur ?

1 votes

Mes serveurs fonctionnent sous Debian Lenny, mais la question n'est pas principalement axée sur la surveillance UNIX seule, car de nombreux outils auront probablement une forme de support multiplateforme.

0 votes

Ils utilisent peut-être des outils différents, mais du point de vue du système global, vous finissez par faire la même chose encore et encore sur les différents systèmes. C'est juste un peu de script pour extraire la dernière partie des données que vous voulez. Dans ce contexte, je considère que les "outils" sont l'instance d'enregistrement (serveur de surveillance) et non le plugin/script qui extrait les données.

10voto

Joseph Pecoraro Points 2200

PRTG Network Monitor - je ne peux pas en dire assez de bien. Une interface web géniale, particulièrement adaptée à la surveillance des routeurs (bande passante, etc.) et d'autres périphériques via SNMP, ainsi qu'à la mesure du temps de fonctionnement pour les accords de niveau de service, etc.

www.paessler.com

8voto

Shawn Miller Points 3875

En tant que personne Windows, MOM. Nous envisageons de passer à Systems Center Operations Manager (SCOM), mais nous n'en aurons pas besoin avant de commencer à déployer Windows 2008.

0 votes

J'utilise aussi MOM. Je l'aime et le déteste en même temps.

0 votes

SCOM est une excellente plateforme de surveillance pour les environnements d'entreprise basés sur Windows. Le vrai génie ici, ce sont les Management Packs publiés par les groupes de produits Microsoft eux-mêmes (cela fait partie des critères communs d'ingénierie de MS, selon lesquels chaque produit doit avoir un MP SCOM dans les 90 jours suivant la sortie de la version de démonstration). Obtenir des conseils et des connaissances de la part des équipes de produits elles-mêmes peut considérablement améliorer la capacité d'un service d'exploitation à maintenir les choses en état de marche et en bonne santé sans avoir à déranger les administrateurs plus expérimentés pour chaque petite chose.

8voto

Judd Points 1120

Pour le suivi des statistiques (utilisation de la mémoire, charge, activité mysql, activité apache, etc.) j'utilise Munin . Il permet déjà de suivre un grand nombre de choses et de tracer des graphiques pour différents intervalles de temps (24 dernières heures, 7 derniers jours, mois dernier, année dernière). Grâce à des plugins, encore plus de choses peuvent être surveillées. Ses résultats sont des pages HTML avec de jolis graphiques.

Munin a une architecture maître/nœud : les nœuds recueillent des statistiques sur un serveur et le maître stocke les données et produit du HTML et des graphiques.

J'utilise Monit Monit peut également surveiller des éléments plus généraux concernant un serveur, tels que la charge du processeur, l'utilisation de la mémoire, l'état du disque dur ou l'utilisation du disque.

Monit doit être configuré pour chaque service ou matériel que vous souhaitez surveiller et pour savoir comment réagir lorsque quelque chose ne va pas. Les options les plus utilisées sont de ne rien faire, d'envoyer un e-mail d'alerte ou de redémarrer le service.

Monit est génial quand il fonctionne, mais parfois il ne parvient pas à démarrer, arrêter ou redémarrer un service et il n'y a pas beaucoup d'informations de diagnostic disponibles pour vous dire ce qui a mal tourné. Cela signifie que vous ne savez pas si le problème vient de votre service ou de la configuration de Monit, qui fonctionne dans un environnement minimal de type cron.

Ces deux outils sont disponibles par défaut sur la plupart des distributions Linux.

8voto

Kristof Provost Points 12359

Je suis surpris que personne n'ait mentionné journal de bord ou vérification du journal pour les serveurs linux - permet d'économiser une tonne de temps de lecture des journaux !

0 votes

Ces outils ne vous permettent pas vraiment d'obtenir des métriques et une lisibilité à long terme des tendances de votre infrastructure. Ils sont un bon complément mais je ne m'y fierais pas uniquement. À ma connaissance, "logwatch" est quelque peu maléfique, car il ne signale que les erreurs que vous lui signalez, contrairement à "logcheck", où vous indiquez à l'outil les bonnes choses connues et il signale tout le reste.

7voto

Dave Anderson Points 5159

Je fais partie d'un projet de mise à niveau de la surveillance opérationnelle. Plusieurs fournisseurs sont venus sur place pour nous présenter quelques systèmes coûteux, ainsi que des alternatives moins chères à comparer.

L'un d'entre eux est Hyperic qui est également disponible sous la forme d'une solution gratuite à code source ouvert. J'ai été impressionné par ses capacités de livraison et son extensibilité pour les agents personnalisés.

0 votes

Bien qu'il ne soit pas facile à utiliser, il s'agit d'un excellent outil de contrôle !

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X