1 votes

Le serveur redémarre de manière inattendue, des messages étranges du noyau dans le fichier journal.

J'ai un serveur fonctionnant sous Ubuntu 10.04 qui redémarre plusieurs fois par jour, semble-t-il, et je n'arrive pas à comprendre pourquoi. Il ne semble pas non plus s'agir d'un redémarrage en douceur, car certains services se plaignent d'un crash lorsque je regarde leurs journaux. Je regarde dans /var/log/messages et je vois beaucoup de déclarations étranges du noyau comme suit :

Jul 27 13:28:41 it-admin kernel: [ 5198.213173] r8169: eth0: link up
Jul 27 13:20:38 it-admin kernel: [ 4716.055043] r8169: eth0: link up
Jul 27 13:29:37 it-admin kernel: [ 5253.309017] r8169: eth0: link up
Jul 27 13:30:29 it-admin kernel: [ 5305.593953] r8169: eth0: link up

Ils s'impriment toutes les quelques secondes comme vous pouvez le voir. Je n'ai jamais vu le noyau dire cela avant, donc je me demande si cela a quelque chose à voir avec ça.

2voto

JBeshir Points 36

Ces messages d'erreur correspondent à un problème que le pilote r8169 de certains noyaux rencontre avec certains matériels, entraînant la perte répétée de la liaison (décrite comme une "paralysie") pour la retrouver plus tard, ce qui entraîne généralement des problèmes de connexion. Ubuntu a un rapport de bogue à ce sujet pour une ancienne version fermée non résolue sur https://bugs.launchpad.net/ubuntu/+source/linux/+bug/378907 .

Une mise à jour du noyau peut le faire disparaître, et a permis de résoudre le problème pour certains, et il y a des discussions sur un correctif qui aurait fonctionné à l'adresse suivante http://adam.rosi-kessel.org/weblog/2008/06/21/a-much-simpler-fix-for-the-r8169-link-down-problem Mais sur mon système (Debian Unstable) avec un noyau 2.6.3x assez récent, la seule façon fiable de résoudre le problème était d'installer le pilote tiers de Realtek pour son matériel, se chargeant sous le nom de 8168, qui n'a pas ce problème. J'essaierais ces choses dans cet ordre.

Je ne vois pas comment ce problème pourrait être lié à des redémarrages inattendus. Les messages pourraient ne pas être liés à votre problème initial de redémarrages, ils pourraient prendre une tournure particulièrement grave sur votre machine, ou vous pourriez avoir des symptômes similaires mais un problème entièrement différent de celui-ci.

0voto

Henk Points 1321

Cela ressemble à un problème de matériel ou de pilote pour moi. Est-ce que le système vraiment Redémarrage ou vous ne voyez que les messages r8169 et la liaison monte et descend tout le temps ?

S'il ne redémarre pas tout le temps : il y a quelques problèmes connus avec le pilote r8169. Une option consiste à désactiver l'auto-négociation pour la carte réseau.

/sbin/ethtool -s eth0 autoneg off

Tiré d'ici : http://www.fedoraforum.org/forum/showpost.php?p=1394807&postcount=1

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X