1 votes

Problèmes bizarres de mise à jour de Windows - perte de connectivité

Je vois un problème vraiment bizarre que j'ai du mal à isoler.

Scénario : Une pile de serveurs Dell Poweredge agissant dans un cluster stable. Lors de l'application de certaines mises à jour de Windows, les serveurs ont perdu la confiance dans Internet et dans le domaine. Impossible de rétablir la confiance du domaine. Désinstallation de la mise à jour, elle a fonctionné. Réinstallation, tout va bien. Même chose sur un autre serveur, j'ai donc pris la décision de reconstruire la ligne de base. Les serveurs ont été reconstruits à partir de zéro : Le dernier firmware a été appliqué (BIOS, NICs, RAID etc.) et le dernier niveau des pilotes. Construction standard 2012R2 Datacenter, mise en réseau et ensuite mise à jour. À différentes étapes de la construction, les mises à jour sont appliquées, ce qui coupe la connexion Internet. Le DNS se résout entièrement, vous pouvez faire un ping, traceroute etc. mais le navigateur ne fonctionne pas. De plus, si vous essayez de rejoindre le domaine à ce stade, le message "Network path not found" apparaît. Les multiples tentatives de restauration de la connectivité échouent.

Dans certains cas, un serveur arrive au stade où il est prêt à se joindre au domaine, après quoi une autre série de mises à jour apparaît après la jointure au domaine, dont certaines vont à nouveau interrompre la connexion Internet. À ce stade, la relation de confiance avec le domaine est également perdue.

La plupart du temps, il suffit de désinstaller la mise à jour la plus récente et de redémarrer pour rétablir la connexion. Vous pouvez ensuite réinstaller exactement la même mise à jour et le serveur continue à se comporter correctement. S'il se trouve sur le domaine à ce moment-là, je dois réinitialiser le compte machine pour rétablir la confiance. Ensuite, cela se reproduira à un stade ultérieur de la construction avec une mise à jour différente.

J'ai exclu qu'il s'agisse d'une mise à jour unique, car cela se produit à différents stades avec l'application de différents rollups. J'ai essayé plusieurs révisions de pilotes/firmware pour le serveur. Il n'y a pas de pare-feu sur le réseau. Aucun logiciel de sécurité. Pas de pare-feu Windows. J'ai même redémarré un serveur et reconstruit son infrastructure NIC en équipe et l'Internet a toujours échoué jusqu'à ce que j'annule la mise à jour et qu'il fonctionne. Puis je l'ai fait avancer à nouveau et le problème a disparu.

La plupart du temps, je peux atteindre un point où le serveur est stable et utilisé en production, tant que je n'applique pas d'autres mises à jour.

Quelqu'un a-t-il l'expérience d'une situation similaire à celle-ci ?

1voto

Cher Points 115

Je pensais poster une mise à jour sur ce problème, maintenant résolu.

Il s'avère que les mises à jour de Windows étaient une fausse piste. Il se trouve que c'était les mises à jour que j'exécutais lorsque le problème est survenu, mais en fait, il semble que c'est simplement le processus de redémarrage qui a tué la pile TCPIP. J'ai pu recréer le problème à plusieurs reprises par un simple redémarrage, puis la réinitialisation par Netsh Winsock Reset et le redémarrage le ramenait à la vie. Bizarrement, la désinstallation d'une mise à jour récente et le redémarrage avaient souvent le même effet - mais pas toujours. Qu'est-ce qui est à l'origine de ce problème ? Il semble que ce soit les cartes NIC. Malgré les derniers firmware et pilotes, l'un des paramètres de RSS (Receive Side Scaling) était à l'origine du problème. Cela permet de répartir le trafic de la carte réseau sur plusieurs processeurs plutôt que de le limiter à un seul. Un réglage typique des performances qui cause plus de problèmes qu'il n'en résout. Je l'ai désactivé et, hey-presto, tout est à nouveau stable. Je peux patcher et redémarrer à ma guise sans perdre la pile TCPIP :)

Un problème très obscur mais peut-être que quelqu'un d'autre trouvera quelque chose de similaire et que la désactivation de RSS pourra aider.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X