5 votes

Choisir un système de surveillance pour un environnement à mise à l'échelle dynamique : Nagios vs. Zabbix

Lorsqu'on travaille dans le cloud et qu'on met à l'échelle des boîtes automatiquement, il y a certains problèmes de surveillance qu'on rencontre. Parfois, on peut surveiller 10 boîtes et parfois 100. Les machines vont s'ajuster en fonction de la demande.

En ce moment, je pense que la meilleure solution à cela est de choisir une solution de surveillance qui instantie des cibles via des appels à une API. Mais, est-ce vraiment le meilleur choix? J'aime l'idée de la découverte dynamique, mais c'est aussi un problème dans le cloud étant donné que les cibles ne sont pas toutes dans le même sous-réseau.

Quelles solutions de surveillance permettent un environnement évolutif comme celui-ci? Zabbix a actuellement une API en cours de rédaction mais je n'ai pas pu trouver une API similaire pour Nagios. Y a-t-il une API similaire pour Nagios?

Est-ce que quelqu'un a des suggestions alternatives autres que Nagios et Zabbix?

3voto

Rob Olmos Points 2210

Farmville, qui prétend ajouter des centaines de serveurs par semaine, utilise Puppet, Nagios et Munin pour gérer son système de surveillance évolutif. Ils utilisent probablement les faits de Puppet pour renseigner les fichiers de configuration de Nagios ou configurer NRPE. Avec autant de serveurs, un outil de gestion de configuration comme Puppet est pratiquement indispensable.

Quelques exemples trouvés en recherchant "puppet nagios" :

http://blog.gurski.org/index.php/2010/01/28/automatic-monitoring-with-puppet-and-nagios/

http://projects.puppetlabs.com/projects/puppet/wiki/Nagios_Patterns

https://github.com/DavidS/puppet-nagios

3voto

Mikhail Krutov Points 101

Utilisez Zabbix. Leur prochaine version 2.0 comprend de nombreuses nouvelles fonctionnalités pour des cas comme celui-ci. La version actuelle 1.8 dispose de l'enregistrement automatique.

Le document des Nouvelles Fonctionnalités parle de cette fonctionnalité:

4.2.2 Enregistrement automatique pour les agents actifs

Complètement nouveau dans Zabbix 1.8, il est possible de permettre l'enregistrement automatique des agents Zabbix actifs, après quoi le serveur peut commencer à les surveiller. Cela permet d'ajouter de nouveaux hôtes à surveiller sans aucune configuration manuelle du serveur pour chaque hôte individuel.

Cette fonctionnalité peut être très pratique pour la surveillance automatique de nouveaux nœuds Cloud. Dès que vous avez un nouveau nœud dans le Cloud, Zabbix démarrera automatiquement la collecte de données de performance et de disponibilité de l'hôte.

1voto

voretaq7 Points 78924

Pas de suggestions, mais votre logique est saine : dans des environnements dynamiques comme celui que vous décrivez, lorsqu'un hôte se met en service, il doit s'enregistrer auprès de tout ce qui doit savoir qu'il existe (par exemple le système de surveillance), et lorsqu'il est arrêté, il doit se désenregistrer des éléments qui doivent savoir qu'il va disparaître.

La question que je poserais est la suivante : avez-vous besoin de surveiller vos serveurs "de travail" ? S'ils servent de nœuds de calcul ou similaires et que vous savez que leur configuration est stable et fonctionnera simplement lorsqu'ils seront démarrés, surveiller le cloud lui-même (combien d'instances sont en cours d'exécution) peut être aussi bon que de suivre les machines individuelles, à condition que votre fournisseur de cloud vous permette d'accéder facilement à de telles statistiques.

1voto

nbussey Points 171

Si vous avez configuré Nagios pour charger des répertoires de fichiers de configuration en utilisant "cfg_dir", vous pouvez simplement ajouter ou supprimer un fichier cfg lorsque un nœud est ajouté ou supprimé, et redémarrer Nagios. Pas vraiment besoin d'une API, cela peut être configuré avec quelques petits scripts shell et SSH avec des fichiers clés.

Je n'ai aucune expérience avec Zabbix mais je peux recommander Nagios car il est assez facile à configurer, exécuter et personnaliser.

1voto

Pour l'API de zabbix, il y a un outil en ligne de commande zabcon (http://trac.red-tux.net/wiki/zbx_api/interactive). il n'est pas encore complètement opérationnel, mais il devrait prendre en charge certaines opérations de base sur les hôtes et les éléments - peut-être pouvez-vous partir de là.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X