18 votes

Surveillance du serveur de production

Nous avons 3 serveurs dédiés, divisés en plusieurs VPS utilisant openVZ. Nous utilisons munin pour surveiller le VPS avec les sites de production, et monit sur l'un des VPS pour s'assurer qu'il redémarre le service en cas d'échec.

Le fait est que nous avons besoin d'un meilleur moyen de surveiller tous nos serveurs, puisque nous avons jusqu'à 14 VPS, nous aimerions avoir un centre où nous pourrions voir non seulement les données collectées par munin, mais aussi d'autres statistiques supplémentaires sur les réseaux et les performances de nos services.

Certaines de nos exigences :
- Notification par SMS en cas d'échec (possibilité de mettre en place certaines vérifications personnalisées)
- Analyseur de logs pour apache error_log et autres.
- Doit être central (c'est-à-dire un serveur et plusieurs nœuds collectant les données).
- Il n'est pas nécessaire qu'il soit facile à installer, mais il doit être facile à entretenir.
- Besoin de liberté

On m'a indiqué nagios et splunk, qu'en pensez-vous ? Je vous remercie,

16voto

faultyserver Points 1914

J'ai une configuration similaire, mais avec Xen en place. J'ai été très heureux avec une combinaison de :

  • Nagios pour les alertes (en utilisant PNP pour des graphiques simples, et Nagviz pour un tableau de bord de l'état des services)
  • Ganglions pour la représentation graphique historique des systèmes
  • OSSEC en tant que HIDS et, ce qui est tout aussi important, en tant que collecteur pour la journalisation centralisée.
    • sidenote : Il existe un plugin Splunk pour OSSEC qui intègre ces deux outils. muy J'attends qu'ils le portent sur Splunk v4.
  • Splunk Enfin, une fois que certains plugins Splunk auront été transférés, nous prévoyons d'utiliser Splunk avec un filtrage préalable des journaux (pour éviter de dépasser le plafond des éditions gratuites).

J'espère que le fait de partager notre système de surveillance vous aidera :-)

Voici quelques liens utiles :

http://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-1/index.html

https://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-2/

http://www.ossec.net/main/splunk-ossec-integration

mettre à jour :

J'ai oublié de mentionner que nous utilisons également le schéma de configuration de Nagios de Matt Simmons, que l'on trouve ici http://www.standalone-sysadmin.com/blog/2009/07/nagios-config/

Cette disposition a rendu notre configuration Nagios saine et beaucoup plus facile à maintenir (Merci Matt !).

5voto

Rikalous Points 2996

J'ai eu beaucoup de succès avec Zabbix Il répond à tous vos besoins en un seul paquet.

alt text
(source : <a href="https://www.zabbix.com/img/screenshots/1.6/monitoring.web.3.png" rel="nofollow noreferrer">zabbix.com </a>)

La partie la plus difficile sera d'obtenir la surveillance des journaux d'Apache, mais Zabbix est extensible et vous pouvez utiliser LogWatch ou un autre script perl pour récupérer les données pour vous.

2voto

Loren Segal Points 2235

J'aime OpManager, qui est gratuit jusqu'à un certain nombre de nœuds. Il fait tout ce qui précède, et est assez facile à installer et à maintenir.

1voto

trashgod Points 119

Nagios devrait être un bon choix. Tout d'abord, il est modulaire et répond à presque toutes vos attentes. De plus, il a reçu quelques récompenses .

EDIT : N'oubliez pas de vérifier cette réponse .

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X