5 votes

Diagnostic d'une panique du noyau

J'ai un PC qui fonctionne sous Ubuntu 9.04 avec le bureau KDE installé. Je l'utilise comme serveur de fichiers/imprimante/IMAP. En général, je l'allume et j'utilise un autre ordinateur pour travailler. Après quelques heures passées à ne rien faire d'autre que d'afficher l'invite de connexion à l'écran, le système s'affole - les voyants des claviers à verrouillage de défilement et à verrouillage des majuscules clignotent.

J'aimerais réparer ça.

Cependant, étant un noob linux, je n'ai aucune idée de par où commencer.

La question est donc de savoir quelle est la meilleure façon de diagnostiquer la cause de la panique.

J'ai fait quelques recherches sur Internet, mais les solutions, si elles existent, sont souvent vagues. Idéalement, la réponse devrait être un organigramme des étapes nécessaires pour déterminer la cause de la panique.

Voir ma réponse ci-dessous pour plus de détails et de questions.

0 votes

Oui, je sais que j'ai accepté ma propre réponse, mais je l'ai marquée CW, et c'est tout le processus que j'ai suivi.

2voto

Steve Tranby Points 3759

Voici ce que j'ai fait (n'hésitez pas à apporter des corrections aux suggestions ci-dessous) :

Mise à jour du logiciel

J'ai remarqué dans la vue de la console mentionnée ci-dessous qu'il y avait un appel à bitmap_weight juste avant le message de panique. J'ai regardé sur le site de nVidia et j'ai trouvé une nouvelle version du pilote vidéo, je l'ai donc téléchargé et installé. J'ai également lancé le gestionnaire de mise à jour pour mettre à jour tous les logiciels de la machine. Je reçois toujours les paniques mais il semble que les intervalles soient plus longs. Je suppose qu'il est toujours conseillé de s'assurer que vous avez toutes les dernières mises à jour. MISE À JOUR : Non, les paniques n'ont pas changé, même la console Ctrl-Alt-F7 affiche les mêmes messages (Comment puis-je faire écrire cela dans un fichier ?!).

Memtest86+ (lien)

S'il n'apparaît pas déjà, appuyer sur 'esc' pendant la séquence de démarrage affiche le menu Grub. Dans ce menu se trouve une option pour exécuter Memtest86+. Sur Ubuntu 9.04, il s'agit de la V2.11. Il y a une V4.00 disponible sur leur site web. Vous devrez télécharger l'image CD ISO, graver un CD avec, redémarrer l'ordinateur et démarrer à partir du CD. Pour mon problème, les tests par défaut n'ont pas mis en évidence de problèmes. En appuyant sur 'c', un menu de configuration s'affiche et il y a un test supplémentaire qui peut être effectué - le test de fondu binaire. Celui-ci prend beaucoup de temps à s'exécuter (il est en cours d'exécution au moment où je tape ces lignes). Si cela met en évidence un problème, essayez de remplacer les puces mémoire et répétez le test. Si l'échec persiste, vous avez probablement besoin d'une nouvelle carte mère.

Résultats des tests : J'ai vérifié le PC ce matin et memtest était toujours en cours - 9 heures sans erreurs. Il m'a confondu au début car il faisait un test en fondu, le minuteur indiquait 20 minutes. J'ai pensé qu'il avait redémarré, mais en fait le minuteur est juste le temps écoulé depuis le début du test d'affaiblissement des bits. En repassant aux tests par défaut, le temps affiché indique le temps total de fonctionnement. Il semble donc que la mémoire soit OK.

kexec-tools et affichage de la console

J'ai maintenant installé kexec-tools bien que ce soit une bête complexe donc je ne pense pas obtenir quelque chose d'utile pour le moment. En faisant cela, cependant, je suis tombé sur une page qui énumère quelques raccourcis clavier utiles . Lors de la connexion, j'ai appuyé sur Ctrl-Alt-F8 pour afficher la sortie de la console. J'ai laissé la machine en marche et elle a paniqué - la console a affiché quelques messages, dont un message de panique. Maintenant, il serait vraiment utile que cette sortie soit sauvegardée dans un fichier car il n'y a que 25 lignes de messages visibles. Quelqu'un sait-il où se trouve ce fichier ou comment l'obtenir pour sauvegarder la sortie ?

Ainsi, dans la console X (l'écran Ctrl-Alt-F8), l'une des fonctions du journal était bitmap_weight, j'ai donc pensé que cela pouvait être la carte vidéo.

Éteindre la vidéo

Dans le dossier /etc se trouve un ensemble de dossiers appelés rc0.d, rc1.d, etc, et ceux-ci contiennent un ensemble de scripts utilisés pour configurer le système. Normalement, les scripts dans rc2.d sont exécutés lorsque vous allumez le système. Ici, le scripts pour démarrer le gestionnaire de fenêtres s'appelle S30gdm pour Gnome et S30kdm pour KDE. Renommez-les en K70gdm / K70kdm et redémarrez le système. Vous avez maintenant une connexion par invite texte, l'interface graphique est désactivée. En faisant cela, le système était beaucoup plus stable, il est resté en vie toute la nuit, ce qu'il n'avait pas fait auparavant. J'ai une carte vidéo nVidia, et en vérifiant leur site web, j'ai vu qu'il y avait eu une mise à jour du pilote vidéo récemment. Je l'ai installé et je vais voir si le problème persiste. Je dois préciser que je maintiens le système à jour avec toutes les mises à jour récentes et je pense qu'il y a eu une mise à jour du noyau qui pourrait avoir affecté l'ancien pilote vidéo.

Enfin, pour restaurer l'interface graphique, renommez K70gdm et/ou K70kdm en S30gdm / S30kdm et redémarrez.

0 votes

Il semble que la carte vidéo était en cause, en la remplaçant par une autre plus ancienne que j'avais, j'ai pu faire fonctionner le système pendant des jours sans aucun problème. Bien sûr, maintenant que j'ai écrit ça, tout va s'écrouler.

0voto

ajc Points 21

Mon approche serait d'obtenir la sortie complète de la panique du noyau (comme sortie sur la console) et de rechercher dans Google le pilote/sous-système qui a causé la panique. Vous le trouverez dans la sortie vers le bas.

Launchpad serait un bon endroit pour rechercher des problèmes spécifiques à Ubuntu.

On ne peut pas non plus exclure une défaillance matérielle, mais il peut aussi s'agir d'un mauvais pilote.

Ces problèmes sont parfois difficiles à diagnostiquer, à moins qu'il ne s'agisse d'un problème déjà observé par d'autres personnes.

0 votes

OK, alors où est-ce que je trouve la sortie ? Je ne me souviens pas si j'ai un login gelé ou un écran vide. Puis-je obtenir ce résultat après le redémarrage de la machine ?

0 votes

Bonjour Skizz, vous devez tout d'abord déterminer si votre noyau est configuré pour "capturer" un crash dump. Pour ubuntu, recherchez "dumputils". La "chaîne de panique" peut également se trouver dans le syslog (/var/log/messages) - il devrait y avoir une "trace de pile" - cela aidera à réduire le champ des recherches.

0 votes

J'ai regardé dans le fichier /var/log/messages et il n'y avait pas beaucoup d'aide là, cependant, j'ai depuis découvert l'option d'écriture du journal en mémoire tampon (je ne sais plus dans quel fichier exactement) donc il y aura peut-être quelque chose là la prochaine fois.

0voto

Broam Points 3939

Il panique juste au ralenti ? Essayez memtest (il devrait être dans le menu d'échappement dans Grub).

Le temps de fonctionnement du memtest est mesuré en heures.

0 votes

C'est certainement quelque chose à faire au début du processus de diagnostic et je vais essayer.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X