6 votes

Windows Server 2008 R2 s'est arrêté tout seul sans raison apparente.

Notre nouveau serveur fonctionnait essentiellement bien depuis quelques mois. Cependant, il s'est arrêté deux fois de lui-même sans raison apparente.

La dernière occurrence s'est produite à 23h41 il y a quelques jours. Les journaux d'événements ne montrent rien d'anormal, et la dernière entrée est une entrée d'audit assez banale dans le journal de sécurité. Le journal de l'onduleur ne montre aucun problème d'alimentation. Rien de particulier ne tournait, car c'était après les heures de bureau. Sauf bien sûr la sauvegarde nocturne, qui démarre à 22 heures. Le journal de sauvegarde ne montre également rien d'intéressant et s'arrête simplement en pleine sauvegarde. Bien que le serveur soit configuré pour écrire un vidage de mémoire et redémarrer, il n'y a pas de vidage de mémoire et le système n'a pas redémarré. Il s'agit d'un serveur de la série HP Proliant ML330 G6.

Lorsque le serveur a été redémarré manuellement le lendemain matin, les événements suivants ont été enregistrés :

Nom du journal : Système
Source : EventLog
Date : 4/16/2011 08:20:22 AM
ID de l'événement : 6008
Catégorie de tâche : Aucune
Niveau : Erreur
Mots clés : Classique
Utilisateur : N/A
Ordinateur : XXXXXXXX.xxxxxxxxxxxxxxxx.local
Description :
L'arrêt précédent du système à 23:41:26 le 15/04/2011 était inattendu.

et

Nom du journal : Système
Source : Microsoft-Windows-Kernel-Power
Date : 4/16/2011 08:20:00 AM
ID de l'événement : 41
Catégorie de tâche : (63)
Niveau : Critique
Mots clés : (2)
Utilisateur : SYSTEM
Ordinateur : XXXXXXXX.xxxxxxxxxxxxxxxx.local
Description :
Le système a redémarré sans s'arrêter proprement au préalable. Cette erreur pourrait être
causée si le système ne répondait plus, plantait, ou perdait de l'alimentation de manière inattendue.

et

Nom du journal : Système
Source : USER32
Date : 4/16/2011 08:22:34 AM
ID de l'événement : 1076
Catégorie de tâche : Aucune
Niveau : Avertissement
Mots clés : Classique
Utilisateur : XXXXXXXXXXXXXXX\Administrator
Ordinateur : XXXXXXXX.xxxxxxxxxxxxxxxx.local
Description :
La raison fournie par l'utilisateur XXXXXXXXXXXXXXX\Administrator pour le dernier arrêt inattendu de cet
ordinateur est : Autre Défaillance : Système non réactif
Code de raison : 0x8000005
ID du problème :
Chaîne d'erreur du noyau :
Commentaire :

J'ai passé un certain temps à rechercher cela et j'ai trouvé très peu d'informations utiles. Quelqu'un a des idées ?

MISE À JOUR : Voici les parties pertinentes du journal iLO2 :

305 04/15/2011 23:42:00 Réinitialisation du serveur.
306 04/15/2011 23:42:00 Alimentation du serveur coupée.
307 04/15/2011 23:42:00 Lien réseau iLO 2 coupé.
308 04/15/2011 23:42:00 Lien réseau iLO 2 établi à 100 Mbps.
309 04/16/2011 08:17:00 Alimentation du serveur rétablie.

MISE À JOUR : J'ai augmenté la taille du fichier d'échange pour permettre des vidages de mémoire complets, donc si c'est vraiment un crash de Windows, je pourrai voir ce qui s'est passé - la prochaine fois que cela se produira.

MISE À JOUR : Le micrologiciel du serveur était déjà à jour.

MISE À JOUR : Il y avait beaucoup de mises à jour disponibles pour les pilotes et les logiciels système. J'en ai installé la plupart et j'attends maintenant de voir si le problème se reproduit.

MISE À JOUR 2018Jun06 : après six ans de fonctionnement sans problème, ce problème est revenu, se produisant deux fois au cours de la dernière semaine environ. J'étudie la possibilité que le panneau avant et son câblage soient défectueux.

MISE À JOUR 2018Nov30 : j'ai finalement remplacé l'ensemble du câblage du panneau avant, mais le problème persiste. La prochaine étape est l'alimentation électrique.

5voto

Cole Points 51

C'est très probablement un kit de câble de commutation d'alimentation/del défectueux. Mon ML310 G5 faisait la même chose, et c'est ce qui a résolu le problème. Apparemment, c'est un problème connu chez HP.

459186-001-02 HEWLETT-PACKARD PROLIANT ML310 G5 SYSTÈME AVANT LED VERS CÂBLE SYS/BRD P/N : 459186-001-02 - ORIGINAUX HEWLETT-PACKARD

2voto

Ryan Raten Kuhar Points 2769

J'ai eu exactement le même problème sur mon serveur 2008 R2. Il s'avère que les processeurs de la série Xeon 5000, que votre machine utilise, ont un problème avec 2008 R2 et le rôle Hyper-V. Je suppose que vous avez le rôle Hyper-V installé, étant donné que le problème est identique à celui que j'ai rencontré.

Il existe un correctif de Microsoft disponible ICI. Je l'ai installé sur mon système et tout fonctionne sans problème depuis.

2voto

Wimmel Points 7641

Je vais peut-être m'aventurer un peu trop ici, mais je pense que vous pourriez avoir besoin d'une mise à jour du micrologiciel. Source. Nous avons eu un problème similaire avec notre DL380 G6 il y a quelque temps.

1voto

iambriansreed Points 143

La machine surchauffe-t-elle? Vérifiez les ventilateurs et les conduits pour les amas de poussière.

1voto

icky3000 Points 4658

Avez-vous le logiciel d'agent de gestion HP installé? Vous mentionnez les journaux d'événements de Windows et les journaux de sauvegarde mais pas les journaux "matériels". Vous devez également regarder là car des arrêts spontanés pourraient être liés à un problème matériel pour lequel vous ne pourrez pas trouver d'informations ailleurs.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X