Il y a quelques semaines, mon serveur linux (kubuntu 10.04) a commencé à me poser des problèmes.
il se bloque après un certain temps de fonctionnement, apparemment entre quelques minutes et quelques heures - l'interface graphique ne répond pas, aucune réaction à la souris ou au clavier (même pas à l'écran). REISUB ), top
dans une session ssh cesse de se mettre à jour et la session elle-même est interrompue après un délai d'attente :
Read from remote host 10.1.1.9: Operation timed out
Connection to 10.1.1.9 closed.
à l'époque, j'ai supposé qu'il s'agissait d'un problème matériel, alors j'ai commencé à remplacer de plus en plus de matériel - carte graphique, carte mère, processeur, mémoire vive, disques durs, alimentation. maintenant, j'ai remplacé toute la machine et elle se bloque toujours.
J'ai vérifié /var/log/messages
et d'autres journaux - il n'y a aucun indice dans ces journaux. un problème matériel semble peu probable étant donné que tout a été remplacé, mais c'est toujours possible.
j'ai réduit la machine au strict minimum. je démarre un système live kubuntu à partir d'une clé usb, je monte deux disques durs en lecture seule et je commence à différencier les dossiers sur ceux-ci. cela semble produire le gel de manière assez fiable. jusqu'à présent, je n'ai pas dépassé quelques heures de fonctionnement.
mon serveur est en panne, cela dure depuis des semaines maintenant. je suis au bout de ma sagesse et je me raccroche à n'importe quoi.
comment puis-je déterminer de manière fiable s'il s'agit d'un problème matériel ou logiciel ? Comment aborder un tel problème ?