3 votes

Débriquetage d'un serveur monté en rack... La sortie VGA ne répond pas, aucune activité de démarrage du réseau.

J'ai un vieux serveur monté en rack (4u) qui démarrait à partir du réseau (avec PXE) lorsqu'il était utilisé. J'avais l'intention d'installer debian ou autre sur les disques durs (il en a 5), alors j'ai essayé wireshark et un serveur DHCP sur une autre boîte. Le serveur a envoyé des découvertes DHCP, mais il ne répondait pas aux offres DHCP de ma boîte. Je suppose qu'il attendait un MAC spécifique ? Meh. Quoi qu'il en soit, je n'ai pas pu accéder à la configuration du BIOS en appuyant sur F2 (le message "Entering Setup..." s'affichait, puis le démarrage continuait), et le menu de configuration PXE n'était d'aucune aide. J'ai un "cd bios" qui, je pense, contient les fichiers de l'utilitaire de configuration, mais c'est là que mes problèmes ont commencé.

Le boîtier était instable depuis le début... parfois il montrait une sortie VGA, parfois non. Parfois, surtout lors des réinitialisations, il ne démarrait même pas et je devais sortir le carlin. Il semblait que les seules fois où il fonctionnait, c'était lorsque je venais physiquement d'insérer la fiche (après l'avoir retirée lorsqu'il était en marche). Lorsque j'ai inséré le CD bios, je crois que c'était juste après la dernière fois qu'il a démarré correctement. Après avoir inséré le disque (il a un lecteur de CD pour une raison quelconque) et l'avoir démarré, il ne voulait tout simplement pas démarrer. Les ventilateurs ont démarré et ont fait leur bruit habituel de décollage, mais pas de sortie VGA et après avoir attendu un certain temps, pas de découverte du DHCP. Sortir le disque et répéter (plusieurs fois) n'a pas donné plus de succès. Je n'ai pas essayé de réinitialiser le CMOS.

Cette machine n'est pas vitale pour quoi que ce soit, mais elle m'a été donnée et ce serait bien de la voir fonctionner. J'ai une brève spécification matérielle dont je peux donner des extraits sur demande. Il s'agit d'un Opteron à double processeur (plutôt bien conçu ; des matrices, des ventilateurs et des dissipateurs séparés) avec des disques SCSI et quatre sur un contrôleur RAID matériel. Le premier BIOS qui s'affiche au démarrage est American Megatrends. Il sortait d'une machine IRM pendant les mises à jour et faisait du traitement de signal (principalement de la transformation de Fourrier) sur les données des capteurs. Il n'y a pas de marque visible à l'intérieur ou à l'extérieur.

EDIT : Je l'ai laissé fonctionner pendant environ une demi-heure, j'ai éteint l'écran et le haut-parleur du PC a émis un bip. J'ai rallumé l'écran et j'ai vu le PXE démarrer et dire Ctrl+S pour la configuration. WTF ? Pour en tirer une leçon, je noterai que le PXE est "Broadcom NetXtreme Ethernet Boot Agent v7.0.3", Copyright 2003. Des idées sur ce qu'il faut conclure de ceci ?

EDIT 2 : Après un autre cycle de débranchement/rebranchement, j'ai vu le démarrage depuis le début et les choses semblent normales. Aucune idée de ce qui se passe maintenant. La prochaine étape consiste à le faire démarrer avec un véritable système d'exploitation. Quelqu'un peut-il m'éclairer sur les problèmes mentionnés dans le premier paragraphe ?

EDIT 3 : Il est encore cassé. Il n'arrive pas à décider s'il est vivant ou non... Je vais l'ouvrir et le démarrer de cette façon pour voir si quelque chose est manifestement faux. Quelqu'un peut-il expliquer cette bizarrerie ? Je n'ai jamais eu quelque chose comme ça avant...

2voto

marcusw Points 163

Eh bien, vous ne devinerez jamais ce que c'était...

J'avais branché un clavier PS/2 en état de marche dans la prise à un moment donné pendant mes tests et je n'y ai pas pensé. C'est un clavier branché là où il est censé aller, quel mal cela pourrait-il faire, non ? Eh bien, je le débranche, et tout fonctionne bien. C'est la chose la plus étrange que j'aie vue depuis longtemps.

Je serais intéressé de savoir pourquoi il a fait ça...

1voto

Peteris Points 196

Cela peut être plusieurs choses. Les problèmes de ce type sont notoirement difficiles à localiser, car ils entrent dans la catégorie "ne fonctionne pas, sans information réelle". Comme il a commencé à fonctionner soudainement, je pense qu'il y avait tellement de poussière à l'intérieur de la machine qu'elle a surchauffé, ou bien un court-circuit dû à un éclat métallique quelque part sur la carte mère qui a finalement été soufflé par les ventilateurs du serveur. C'est d'autant plus possible qu'il se trouvait dans la même pièce qu'une machine IRM qui ferait toutes sortes de choses amusantes avec les minuscules particules de métal de la taille d'une poussière.

Ça pourrait aussi être, sans ordre particulier :

  • Problèmes avec la mise à jour du BIOS
  • Connexion lâche quelque part dans le système
  • Capsules soufflées
  • Mémoire mal placée

Puisqu'il ne s'affiche même pas correctement, je chercherais d'abord des problèmes matériels. Ouvrez-le et dépoussiérez l'intérieur, remettez la RAM en place. Si vous vous sentez aventureux, retirez soigneusement les processeurs et mettez du nouveau gel sur les dissipateurs thermiques ainsi que de la poussière sur les prises. Avec un peu de chance, cela le fera fonctionner à nouveau. Bonne chance !

0voto

Tieme Points 101

Vous avez mentionné la mise en place d'un CD de BIOS. Essayez-vous de mettre à jour le BIOS ? Si oui, il se peut qu'il y ait un problème avec la version que vous essayez de mettre à jour ? Je pense que le BIOS de secours est en train d'entrer en action. Il y a un problème avec le BIOS principal.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X