1 votes

Comment déboguer un blocage total du système ?

J'utilise la dernière version d'Ubuntu 20.04 LTS sur un puissant PC de bureau. Il fonctionne bien la plupart du temps, mais de temps en temps, mon système se bloque de manière aléatoire, comme décrit plus en détail ci-dessous. Certains jours, il se produit toutes les deux heures, ce qui entraîne une perte de données et devient très ennuyeux. Cela ne m'est jamais arrivé avec Microsoft Windows sur le même PC (mais je n'utilise pas ce système d'exploitation très souvent).

Voici la situation décrite plus en détail. Je travaille tranquillement sur mon PC, sans faire de calculs intensifs. Tout à coup, l'écran se fige, y compris le curseur de la souris. Si j'ai une lecture audio en cours, elle continuera à tourner en boucle pendant quelques secondes avant de s'arrêter complètement. Les touches Magic SysRq ne fonctionnent plus à ce moment-là ! Je dois éteindre mon PC en maintenant le bouton d'alimentation enfoncé. Aucun rapport d'erreur automatique n'est généré.

Comment commencer à analyser la cause de ce problème ? C'est très difficile pour deux raisons : 1. il est intermittent, et 2. le système ne répond plus du tout, ne permettant aucune entrée de commande.

Bien que le titre de cette question soit assez général, j'apprécierais des conseils à la fois généraux et spécifiques.


Voici ce que j'ai déjà essayé : J'ai exécuté les deux commandes suivantes sudo dmesg -Tw y tail -f /var/log/syslog dans un émulateur de terminal en arrière-plan. Aucun des deux ne produisait de données au moment où le gel s'est produit.

0voto

FelixJN Points 229

Il semble qu'Intel ait les mêmes problèmes que ceux que j'ai rencontrés avec mon ordinateur portable basé sur Ryzen.

Informations générales : Les états C sont des modes d'économie d'énergie du CPU, activés pour réduire la consommation d'énergie, mais il semble qu'il y ait des bogues lors de l'entrée ou de la sortie d'un tel état. Voir bugzilla (oui, très vieux). Plus l'état C est élevé, plus le CPU "dort".

Essayez ce qui suit : dans /etc/default/grub modifier la ligne

 GRUB_CMDLINE_LINUX_DEFAULT="quiet"

à

 GRUB_CMDLINE_LINUX_DEFAULT="quiet intel_idle.max_cstate=5"

puis exécuter update-grub et redémarrer. Si cela ne fonctionne toujours pas, réduisez l'état C max. C à 1. Notez que cela implique une plus grande consommation d'énergie.

Il existe également un bugfix script de 2016 qui prétend ne désactiver que C6 (ne le lancez pas, lisez-le d'abord). Regardez si vous pouvez trouver ces fichiers listés dans le script. /sys/devices/system/cpu/cpuX/cpuidle/stateY/CZ*-BYT et vérifier leur contenu.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X