2 votes

Nombre acceptable d'erreurs Ethernet dans un environnement de taille moyenne?

Je suis en train de mettre en place un système de surveillance pour un déploiement de centre de données de taille modeste existant.

Jusqu'à présent, je suis seulement arrivé du côté hôte/application de l'équation de surveillance, mais je remarque ce que je considère être un nombre alarmant d'erreurs Ethernet sur divers hôtes. Pour moi, alarmant signifie 3 ou 4 par jour par hôte (certains n'en ont aucun). Lorsque je regarde les compteurs SNMP des commutateurs, je vois à nouveau beaucoup d'erreurs sur les compteurs, mais je ne graphique pas encore ces erreurs.

Dans mes environnements précédents avec beaucoup plus de ports, mon taux d'erreur était approximativement nul, sauf pour ces hôtes qui avaient des problèmes réels comme des incompatibilités de duplex.

Aucune de ces interfaces n'est saturée; elles transmettent environ 40-50 mégaoctets/s sur des liens gigabit.

J'ai le sentiment que s'il fonctionne correctement, il ne devrait y avoir aucune erreur sur quelque interface que ce soit, mais j'ai peur que si je me bats pour résoudre ces problèmes, je n'aliénerai que les autres qui pensent que "ça fonctionne très bien, ça fonctionne comme ça depuis des années".

Quelqu'un a-t-il de bonnes histoires/études/statistiques pour savoir quand s'alarmer des erreurs Ethernet? Ou quelque chose pour indiquer comment un petit volume d'erreurs pourrait affecter, par exemple, un volume iSCSI?

Merci!

1voto

Hyppy Points 15356

TCP/IP peut gérer assez bien les erreurs. Une seule erreur sera retransmise et tout se passera généralement très bien.

Un nombre constant de 3 à 4 erreurs par jour est alarmant car cela indique un possible problème (mauvais câble, port, etc), mais en soi ce n'est pas un problème majeur. Une seule erreur peut être le résultat de tout, de l'interférence électromagnétique à un événement subatomique très mal positionné. Dans les deux cas, l'impact sur votre réseau est négligeable.

Si cela devient un enjeu politique, laissez tomber (mais gardez un œil dessus). Je m'en énerverais seulement si je commençais à voir des erreurs se produirent BEAUCOUP plus souvent, ou du moins en tant que pourcentage plus élevé du total des paquets. 0,1 % peut être un bon seuil, mais tout dépend de la solidité de la position que vous prendrez.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X