Voici donc les étapes de dépannage (en supposant que vous vous arrêtez après chacune d'elles et que vous attendez que le problème réapparaisse) :
- Vérifiez les journaux du commutateur pour voir s'ils vous disent pourquoi il utilise 100M.
- Si vous l'utilisez toujours, désactivez cette connerie extrêmement maléfique d'"équilibrage de charge Windows" que Joel pousse tout le temps -- la façon dont cela fonctionne est de casser le cache du commutateur, le forçant à traiter chaque paquet par logiciel. Votre commutateur est conçu pour transmettre les paquets de manière matérielle, et ne possède que le CPU nécessaire pour déterminer le chemin physique qu'un flux de trafic inconnu doit prendre (entrée -> asic -> sortie), et programmer le matériel pour le faire (lisez : une calculatrice a un meilleur CPU que votre commutateur, ne faites pas de choses stupides qui font travailler le CPU de votre commutateur plus dur). L'équilibrage de charge Windows fonctionne en faisant en sorte que votre commutateur prenne cette décision et réinstalle le cache matériel pour chaque paquet. Cela ne résout peut-être pas ce problème particulier, mais cela m'embête depuis les podcasts... désolé.
- Assurez-vous que la configuration correspond aux deux côtés - il semble que vous l'ayez fait.
- Cherchez sur Google les bugs d'autoneg sur votre commutateur - à moins que vous ne l'ayez construit vous-même, vous n'êtes pas le seul à essayer de faire fonctionner autoneg sur ce que vous utilisez.
- Remplacez le câble par un câble Cat5e ou supérieur, idéalement un câble dont vous savez qu'il fonctionne, comme celui auquel votre poste de travail est branché. N'essayez pas d'utiliser un câble Cat5, ou une merde fabriquée par quelqu'un d'autre, utilisez un câble dont les extrémités sont moulées à partir d'un emballage.
- Déplacer le port -- Placer le serveur sur un autre port du même commutateur.
- Changez la NIC -- utilisez un lot différent commandé à un moment différent
À ce stade, vous avez éliminé la configuration, les ports physiques sur lesquels vous êtes branchés, le câblage entre eux. Si c'est toujours se produisant, d'autres causes peuvent l'être :
- Acheminement des câbles - faites attention aux interférences électromagnétiques de vos câbles d'alimentation CA, acheminez-les sur différents côtés du rack.
- Refroidissement -- Assurez-vous que la température ambiante n'est pas de l'ordre de 90 degrés et que vos cartes NIC ne se mettent pas dans une sorte de mode "mon Dieu, laissez-moi juste transférer ce paquet, s'il vous plaît". J'ai entendu dire, mais pas vu, que les routeurs Cisco arrêtent de faire du fast-switching et transfèrent les paquets via le CPU quand ils surchauffent, par exemple.
- Remplacez le commutateur par quelque chose qui ne craint pas - vérifiez combien de bande passante vos hôtes utilisent par seconde en agrégat, puis regardez la capacité nominale du fond de panier de votre commutateur. 7 hôtes sur les 48 potentiels transmettant tous 1.0G est suffisant pour arrêter un Cisco 3750, par exemple. Soyez également très Attention aux fournisseurs de réseaux bon marché : D-Link, Linksys, Dell, Intel et HP. Personne qui prend les réseaux au sérieux n'utilise ces types de produits, et ce non pas parce que "personne n'a jamais été licencié pour avoir utilisé Cisco", mais parce que "les gens se souviennent de ce commutateur Intel dont les 20/48 ports sont tombés en panne en deux ans" ou du "j'utilisais exclusivement ProCurve et me plaignais de la méchanceté de Cisco, jusqu'à ce que j'utilise réellement Cisco, après quoi j'ai arrêté d'acheter tout ce qui était inférieur". Cisco est considéré comme un milieu de gamme vendeur de réseau, donc qu'est-ce que ça vous dit sur les gars en dessous de Cisco... ? :-)
Contexte/pourquoi ma réponse est la plus géniale : Je travaille en tant qu'ingénieur réseau/système dans le secteur financier, et voici mon expérience avec notre petit réseau mondial (15 succursales, 8 centres de données) :
Tous nos ports LAN sont autoneg, parce que nous contrôlons l'équipement des deux côtés et que nous avons une sorte d'accès aux deux côtés - ce qui peut être aussi simple que de téléphoner à quelqu'un et de lui demander de vérifier les paramètres. En trois ans, je n'ai eu qu'un seul de nos ports internes qui est tombé en panne à cause d'une défaillance d'autoneg, et c'était à cause d'un mauvais câble - il est parti après avoir remplacé le câble.
Nous avons eu beaucoup plus de problèmes lorsque les prédécesseurs avaient codé en dur 100/full sur leurs NIC, et n'avaient pas documenté ce fait. Nous avons tout réinitialisé sur auto/auto à la prochaine fenêtre de maintenance et nous n'avons plus eu de problèmes avec eux depuis.
Sur les quelques endroits où nous avons un transfert de cuivre d'un transporteur pour notre WAN ? Il faut s'attendre à ce qu'une connexion WAN/Internet en cuivre soit mauvaise, tout le temps - en partie parce que vous n'avez aucune idée de ce qui se trouve de l'autre côté. Un vieux commutateur Extreme dont le firmware est bogué pour autoneg mais qui fait du marquage MPLS ? Un convertisseur de média à 5 $ parce que le dispositif de pointe Ciena à 200 000 $ de votre FAI est tout simplement trop génial pour fournir l'Ethernet sur une paire torsadée ? Décidez à l'avance comment cela va être géré et tenez-vous en à cela, puis attendez qu'un idiot de l'opérateur le change à 22h un samedi parce que la configuration convenue n'a jamais été documentée et qu'ils ont une politique à suivre.
Sérieusement, obtenez un transfert de fibre optique de votre FAI.