2 votes

Panique du noyau du serveur Debian - Fréquence croissante

Le serveur s'est d'abord planté il y a une semaine dans une panique du noyau, puis a redémarré, a effectué un FSCK et s'est remis en marche normalement.

Cela s'est produit à nouveau ce matin. Même panique, redémarrage, FSCK et ensuite démarrage.

Cependant, cela s'est reproduit aujourd'hui. J'ai demandé à voir le message de panique de la société de serveurs et j'ai obtenu ce qui suit, qui semble mentionner le système de fichiers ext3. Si quelqu'un peut m'aider à décoder ce que cela signifie exactement et ce qui pourrait être le problème, ce serait formidable :

Kernel Panic Error 1

Kernel Panic Error 2

Pour une raison quelconque, les deux images ne s'affichent pas, alors voici les deux URL http://i.stack.imgur.com/hjOZ5.jpg http://i.stack.imgur.com/NrHwr.jpg

0 votes

Quelle était la tâche suspendue dans la deuxième capture d'écran ?

4 votes

Avez-vous effectué un test de mémoire vive ( memtest.org ) et/ou le serveur dispose-t-il d'une mémoire vive ECC ? Bien qu'il soit possible que vous ayez un véritable problème logiciel, j'écarte généralement la possibilité d'une mauvaise mémoire vive en premier lieu lorsque je traite des paniques.

0 votes

@Satanicpuppy - Je n'en suis pas sûr.

1voto

wazoox Points 6554

Si la RAM est exclue... regardez dans la sortie 'dmesg' les messages relatifs au disque. Vous avez peut-être un disque défaillant. Utilisez-vous RAID ? Essayez d'exécuter un auto-test intelligent sur les disques :

smartctl -t short /dev/sdXX

Attendez quelques minutes, puis exécutez

smartctl -a /dev/sdXX

pour lire les informations.

0 votes

Il a de nouveau rendu l'âme alors que la commande smartctl était en cours d'exécution. Juste avant cela, j'ai reçu "kernel : [9777.519387] journal commit I/O error". En regardant la sortie de dmesg Je remarque 'EXT3-fs : sda1 : orphan cleanup on readonly fs' et six 'ext3_orphan_cleanup : deleting unreferenced inode 6062133'. Cela indiquerait-il un disque défaillant ?

0 votes

S'il s'agit d'un serveur dédié : n'excluez pas un problème de carte RAID ou de puce de carte mère.

0 votes

En effet. Je pense qu'un changement de serveur pourrait être nécessaire, étant donné que le fournisseur ne semble pas vouloir modifier le matériel avant que quelque chose n'explose vraiment.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X