3 votes

Surveillance des alertes e-mail de manière évolutive

Quelqu'un connaît-il un moyen de surveiller les alertes e-mail de manière évolutive ?

Pour beaucoup de mes services sur site, je leur demande de m'envoyer des courriels sur la réussite (et l'échec) de tâches critiques. La raison pour laquelle je leur demande de m'envoyer un e-mail en cas de succès est que parfois l'échec est tel que le service ne peut pas envoyer d'alerte d'échec.

Malheureusement, cela ne fonctionne pas à l'échelle. Je reçois maintenant tellement d'alertes que je ne les surveille pas vraiment, mais je ne peux pas me permettre d'alerter en cas d'échec, car cela s'est avéré trop peu fiable par le passé.

Ce que je voudrais idéalement, c'est un service en nuage (ou une boîte aux lettres), quelque chose de similaire à Pingdom, auquel je puisse envoyer/transférer ces alertes, qui m'enverra un e-mail/sms lorsqu'il recevra une alerte d'échec, ou lorsqu'il manquera des alertes de succès.

Quelqu'un a une idée ?

10voto

voretaq7 Points 78924

Ce que vous proposez, c'est de réimplémenter efficacement votre système de surveillance (en alimentant les alertes du système actuel dans un autre système de surveillance qui est suffisamment intelligent pour savoir que quelque chose ne va pas s'il n'est pas constamment rassuré que tout va bien).

Ce n'est certainement pas ce dont vous avez besoin. Ce dont vous avez besoin, c'est d'une combinaison de surveillance sur site et hors site qui de manière fiable vous envoyer des alertes en cas de défaillance (du système interne normalement, ou du système externe si, pour une raison quelconque, le système interne a échoué).


Veuillez garder à l'esprit l'axiome suivant concernant les systèmes de surveillance :

Il n'y a pas de bonne raison d'alerter sur le succès.

L'alerte en cas de succès est le défaut de configuration amateur le plus courant d'un système de surveillance.
Un système de surveillance doit uniquement vous alerter sur des choses qui nécessitent une action .

Le succès, par définition, n'est pas un événement nécessitant une action, donc aucune alerte ne doit être générée.
L'absence de succès est par définition un "échec", et une alerte d'échec exploitable doit donc être générée.

L'envoi de messages d'état "tout va bien" finit par entraîner les gens à ignorer les messages du système de surveillance (car aucune action n'est requise la plupart du temps). Vous voulez que les alertes de surveillance soient des événements choquants qui incitent les gens à agir, et non des nuisances de routine qui sont effacées de leur boîte de réception par la mémoire musculaire.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X