90 votes

Le matériel réseau doit-il être réglé sur des vitesses " autonégociées " ou sur des vitesses fixes ?

Nous J'ai récemment eu un petit problème avec un réseau où plusieurs serveurs perdaient par intermittence la connectivité réseau d'une manière assez pénible à résoudre (il fallait redémarrer le système). Cela dure depuis environ deux semaines, apparemment au hasard, sur différents serveurs. Aucun modèle particulier n'a pu être discerné.

Après quelques recherches, nous avons constaté que le commutateur signalait 100 Mbps pour le port problématique :

Cela ressemble beaucoup à ce qui s'est passé dans l'article de Joel Spolsky. Cinq raisons

Michael a passé un certain temps à faire un post-mortem, et a découvert que le problème était un simple problème de configuration sur le commutateur. Il existe plusieurs vitesses possibles qu'un commutateur peut utiliser pour communiquer (10, 100 ou 1000 mégabits/seconde). Vous pouvez soit définir la vitesse manuellement, soit laisser le commutateur négocier automatiquement la vitesse la plus élevée avec laquelle les deux parties peuvent travailler. Le commutateur qui a échoué avait été configuré en auto-négociation. Cela fonctionne généralement, mais pas toujours, et le matin du 10 janvier, ce n'était pas le cas.

Nous avons maintenant auto-négociation désactivée sur notre matériel réseau et le régler sur un taux fixe de 1000 Mbps (gigabit).

Mes questions à ceux qui ont plus d'expertise en matière de mise en réseau du matériel de serveur :

  1. Dans quelle mesure les problèmes d'auto-négociation sont-ils courants avec le matériel réseau moderne ?
  2. Est-il considéré comme une bonne pratique standard de désactiver la négociation automatique et de définir des vitesses fixes lors de la mise en place d'un réseau ?

101voto

Doug Luxem Points 9572
  1. Je n'ai pas encore vu de problème avec l'auto-négociation des vitesses du réseau qui ne soit pas causé par (a) un décalage entre le mode manuel à une extrémité du lien et le mode automatique à l'autre extrémité ou (b) un composant défaillant du lien (câble, port, etc.).

  2. Cela dépend de l'administrateur, mais mon expérience m'a montré que si vous spécifiez manuellement les vitesses de liaison et les paramètres duplex, vous risquez de rencontrer des décalages de vitesse. Pourquoi ? Parce qu'il est presque impossible de documenter les différentes connexions entre les commutateurs et les serveurs, puis de suivre cette documentation lors des modifications. La plupart des échecs que j'ai vus sont dus au point 1(a) et vous ne vous retrouvez dans cette situation que lorsque vous commencez à définir manuellement les paramètres de vitesse/duplex.

Comme mentionné dans le Documentation Cisco :

Si vous désactivez l'auto-négociation, elle masque les interruptions de liaison et autres problèmes de couche physique. Ne désactivez l'auto-négociation que pour les périphériques finaux, tels que les anciennes cartes d'interface réseau Gigabit qui ne prennent pas en charge l'auto-négociation Gigabit. Ne désactivez pas l'auto-négociation entre les commutateurs, sauf en cas d'absolue nécessité, car les problèmes de couche physique peuvent ne pas être détectés et entraîner des boucles de spanning tree.

À moins que vous ne soyez prêt à mettre en place un système de gestion des modifications du réseau nécessitant la vérification de la vitesse/duplex (sans oublier le contrôle de flux) ou que vous ne soyez prêt à faire face aux décalages occasionnels résultant de la spécification manuelle de ces paramètres sur tous les périphériques du réseau, conservez la configuration par défaut de auto/auto.

A l'avenir, envisagez de surveiller les erreurs sur les ports du commutateur avec MRTG afin que vous puissiez repérer ces questions avant d'avoir un problème.

編集する。 Je vois beaucoup de gens évoquer des échecs de négociation sur de vieux équipements. Oui, c'était un problème il y a longtemps, lorsque les normes étaient créées et que tous les appareils ne les suivaient pas. Vos cartes réseau et vos commutateurs ont-ils moins de 10 ans ? Si oui, ce ne sera pas un problème.

23voto

einstiien Points 2528
  1. Très courant, j'ai eu de nombreux problèmes au fil des ans avec différents types de matériel.

  2. À mon avis, si la configuration est statique (par exemple, un rack de serveurs) et que vous ne pensez pas qu'il y aura des changements, c'est une bonne idée de configurer les vitesses et les duplex manuellement. Tant que cela est bien documenté afin d'éviter tout problème futur.

EDIT :

Pour clarifier les choses, je ne préconise pas l'utilisation de vitesses manuelles sur l'ensemble de votre réseau. Je dirais que, dans 95 % des cas, la méthode auto/auto est la meilleure. Je dis simplement que j'ai eu des problèmes avec le duplex/la vitesse et qu'il y a de petites portions de mon réseau (c'est-à-dire l'une de nos baies de serveurs) qui ont principalement des paramètres manuels. Nous exploitons un réseau local très étroitement contrôlé avec des ports inutilisés qui sont fermés et des filtres MAC sur la plupart des ports, de sorte que le suivi des vitesses n'est pas très difficile.

15voto

ThinkingStiff Points 101

Je pense que si l'auto-négociation fonctionne pendant une heure, un jour ou un mois et que pour une raison quelconque, "quelque chose se passe" et que le fait de régler le lien sur la vitesse fixe "le répare", il y a un problème qui n'est pas résolu mais contourné. Je suppose que je vois la mise en place du lien à vitesse fixe comme une solution temporaire jusqu'à ce que le vrai problème soit corrigé.

15voto

Cory Dee Points 1527

Voici donc les étapes de dépannage (en supposant que vous vous arrêtez après chacune d'elles et que vous attendez que le problème réapparaisse) :

  1. Vérifiez les journaux du commutateur pour voir s'ils vous disent pourquoi il utilise 100M.
  2. Si vous l'utilisez toujours, désactivez cette connerie extrêmement maléfique d'"équilibrage de charge Windows" que Joel pousse tout le temps -- la façon dont cela fonctionne est de casser le cache du commutateur, le forçant à traiter chaque paquet par logiciel. Votre commutateur est conçu pour transmettre les paquets de manière matérielle, et ne possède que le CPU nécessaire pour déterminer le chemin physique qu'un flux de trafic inconnu doit prendre (entrée -> asic -> sortie), et programmer le matériel pour le faire (lisez : une calculatrice a un meilleur CPU que votre commutateur, ne faites pas de choses stupides qui font travailler le CPU de votre commutateur plus dur). L'équilibrage de charge Windows fonctionne en faisant en sorte que votre commutateur prenne cette décision et réinstalle le cache matériel pour chaque paquet. Cela ne résout peut-être pas ce problème particulier, mais cela m'embête depuis les podcasts... désolé.
  3. Assurez-vous que la configuration correspond aux deux côtés - il semble que vous l'ayez fait.
  4. Cherchez sur Google les bugs d'autoneg sur votre commutateur - à moins que vous ne l'ayez construit vous-même, vous n'êtes pas le seul à essayer de faire fonctionner autoneg sur ce que vous utilisez.
  5. Remplacez le câble par un câble Cat5e ou supérieur, idéalement un câble dont vous savez qu'il fonctionne, comme celui auquel votre poste de travail est branché. N'essayez pas d'utiliser un câble Cat5, ou une merde fabriquée par quelqu'un d'autre, utilisez un câble dont les extrémités sont moulées à partir d'un emballage.
  6. Déplacer le port -- Placer le serveur sur un autre port du même commutateur.
  7. Changez la NIC -- utilisez un lot différent commandé à un moment différent

À ce stade, vous avez éliminé la configuration, les ports physiques sur lesquels vous êtes branchés, le câblage entre eux. Si c'est toujours se produisant, d'autres causes peuvent l'être :

  1. Acheminement des câbles - faites attention aux interférences électromagnétiques de vos câbles d'alimentation CA, acheminez-les sur différents côtés du rack.
  2. Refroidissement -- Assurez-vous que la température ambiante n'est pas de l'ordre de 90 degrés et que vos cartes NIC ne se mettent pas dans une sorte de mode "mon Dieu, laissez-moi juste transférer ce paquet, s'il vous plaît". J'ai entendu dire, mais pas vu, que les routeurs Cisco arrêtent de faire du fast-switching et transfèrent les paquets via le CPU quand ils surchauffent, par exemple.
  3. Remplacez le commutateur par quelque chose qui ne craint pas - vérifiez combien de bande passante vos hôtes utilisent par seconde en agrégat, puis regardez la capacité nominale du fond de panier de votre commutateur. 7 hôtes sur les 48 potentiels transmettant tous 1.0G est suffisant pour arrêter un Cisco 3750, par exemple. Soyez également très Attention aux fournisseurs de réseaux bon marché : D-Link, Linksys, Dell, Intel et HP. Personne qui prend les réseaux au sérieux n'utilise ces types de produits, et ce non pas parce que "personne n'a jamais été licencié pour avoir utilisé Cisco", mais parce que "les gens se souviennent de ce commutateur Intel dont les 20/48 ports sont tombés en panne en deux ans" ou du "j'utilisais exclusivement ProCurve et me plaignais de la méchanceté de Cisco, jusqu'à ce que j'utilise réellement Cisco, après quoi j'ai arrêté d'acheter tout ce qui était inférieur". Cisco est considéré comme un milieu de gamme vendeur de réseau, donc qu'est-ce que ça vous dit sur les gars en dessous de Cisco... ? :-)

Contexte/pourquoi ma réponse est la plus géniale : Je travaille en tant qu'ingénieur réseau/système dans le secteur financier, et voici mon expérience avec notre petit réseau mondial (15 succursales, 8 centres de données) :

Tous nos ports LAN sont autoneg, parce que nous contrôlons l'équipement des deux côtés et que nous avons une sorte d'accès aux deux côtés - ce qui peut être aussi simple que de téléphoner à quelqu'un et de lui demander de vérifier les paramètres. En trois ans, je n'ai eu qu'un seul de nos ports internes qui est tombé en panne à cause d'une défaillance d'autoneg, et c'était à cause d'un mauvais câble - il est parti après avoir remplacé le câble.

Nous avons eu beaucoup plus de problèmes lorsque les prédécesseurs avaient codé en dur 100/full sur leurs NIC, et n'avaient pas documenté ce fait. Nous avons tout réinitialisé sur auto/auto à la prochaine fenêtre de maintenance et nous n'avons plus eu de problèmes avec eux depuis.

Sur les quelques endroits où nous avons un transfert de cuivre d'un transporteur pour notre WAN ? Il faut s'attendre à ce qu'une connexion WAN/Internet en cuivre soit mauvaise, tout le temps - en partie parce que vous n'avez aucune idée de ce qui se trouve de l'autre côté. Un vieux commutateur Extreme dont le firmware est bogué pour autoneg mais qui fait du marquage MPLS ? Un convertisseur de média à 5 $ parce que le dispositif de pointe Ciena à 200 000 $ de votre FAI est tout simplement trop génial pour fournir l'Ethernet sur une paire torsadée ? Décidez à l'avance comment cela va être géré et tenez-vous en à cela, puis attendez qu'un idiot de l'opérateur le change à 22h un samedi parce que la configuration convenue n'a jamais été documentée et qu'ils ont une politique à suivre.

Sérieusement, obtenez un transfert de fibre optique de votre FAI.

14voto

Jason Antman Points 1546

Le réseau dont je suis responsable (avec quelques autres personnes) se compose d'environ 40 serveurs, de plus de 1 000 postes de travail (répartis sur un campus assez vaste) et d'environ 1 000 WAP également répartis sur une vaste zone avec des équipements réseau de types et d'âges différents.

Comme l'a dit dimitri.p, lorsque quelque chose s'arrête soudainement d'auto-négocier, c'est généralement une indication d'un autre problème. Configurer le port manuellement revient à mettre un pansement sur quelqu'un qui a été poignardé dans le ventre - cela peut arrêter l'hémorragie, mais il y a certainement des dégâts en dessous.

Ma liste de contrôle habituelle :

  • Quelque chose a-t-il changé sur la machine ? Les pilotes ? Les paramètres du système d'exploitation ou du BIOS ? Peut-être autoneg a-t-il été désactivé dans le système d'exploitation ?
  • avez-vous échangé les câbles de connexion, et vérifié les chemins de câbles (s'il s'agit d'un chemin plus long qu'un rack ?)
  • Avez-vous testé pour voir si le port du commutateur est mauvais ou défaillant ?
  • La carte réseau pourrait-elle être défectueuse ?

Nous, en règle générale, jamais désactiver autoneg sur les serveurs (ou tout autre élément du centre de données) à moins qu'il ne s'agisse d'une situation où toutes les autres causes possibles ont été éliminées, où nous avons déplacé les ports du commutateur, changé les câbles, testé la carte réseau, etc. et où il n'y a pas d'autre choix. Dans ce cas, le problème est documenté à mort. Cela arrive très rarement, et généralement avec des appareils auxquels nous ne pouvons pas accéder pour vérifier les paramètres du BIOS et du système d'exploitation.

Les postes de travail et les points d'accès, par contre, c'est une autre histoire. L'échec de l'autonéglage est le signe classique d'un mauvais câblage, et nous devons souvent régler manuellement la vitesse et le duplex jusqu'à ce que la saison estivale des nouveaux câbles dans les murs arrive.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X