Je vois un problème vraiment bizarre que j'ai du mal à isoler.
Scénario : Une pile de serveurs Dell Poweredge agissant dans un cluster stable. Lors de l'application de certaines mises à jour de Windows, les serveurs ont perdu la confiance dans Internet et dans le domaine. Impossible de rétablir la confiance du domaine. Désinstallation de la mise à jour, elle a fonctionné. Réinstallation, tout va bien. Même chose sur un autre serveur, j'ai donc pris la décision de reconstruire la ligne de base. Les serveurs ont été reconstruits à partir de zéro : Le dernier firmware a été appliqué (BIOS, NICs, RAID etc.) et le dernier niveau des pilotes. Construction standard 2012R2 Datacenter, mise en réseau et ensuite mise à jour. À différentes étapes de la construction, les mises à jour sont appliquées, ce qui coupe la connexion Internet. Le DNS se résout entièrement, vous pouvez faire un ping, traceroute etc. mais le navigateur ne fonctionne pas. De plus, si vous essayez de rejoindre le domaine à ce stade, le message "Network path not found" apparaît. Les multiples tentatives de restauration de la connectivité échouent.
Dans certains cas, un serveur arrive au stade où il est prêt à se joindre au domaine, après quoi une autre série de mises à jour apparaît après la jointure au domaine, dont certaines vont à nouveau interrompre la connexion Internet. À ce stade, la relation de confiance avec le domaine est également perdue.
La plupart du temps, il suffit de désinstaller la mise à jour la plus récente et de redémarrer pour rétablir la connexion. Vous pouvez ensuite réinstaller exactement la même mise à jour et le serveur continue à se comporter correctement. S'il se trouve sur le domaine à ce moment-là, je dois réinitialiser le compte machine pour rétablir la confiance. Ensuite, cela se reproduira à un stade ultérieur de la construction avec une mise à jour différente.
J'ai exclu qu'il s'agisse d'une mise à jour unique, car cela se produit à différents stades avec l'application de différents rollups. J'ai essayé plusieurs révisions de pilotes/firmware pour le serveur. Il n'y a pas de pare-feu sur le réseau. Aucun logiciel de sécurité. Pas de pare-feu Windows. J'ai même redémarré un serveur et reconstruit son infrastructure NIC en équipe et l'Internet a toujours échoué jusqu'à ce que j'annule la mise à jour et qu'il fonctionne. Puis je l'ai fait avancer à nouveau et le problème a disparu.
La plupart du temps, je peux atteindre un point où le serveur est stable et utilisé en production, tant que je n'applique pas d'autres mises à jour.
Quelqu'un a-t-il l'expérience d'une situation similaire à celle-ci ?