L'un de mes serveurs ne répond plus du tout :
top - 06:16:53 up 2:14, 1 user, load average: 30.95, 29.96, 22.92
Tasks: 168 total, 2 running, 166 sleeping, 0 stopped, 0 zombie
%Cpu(s): 0.0 us, 12.6 sy, 0.0 ni, 0.0 id, 86.4 wa, 0.0 hi, 0.0 si, 1.1 st
KiB Mem : 1014524 total, 61368 free, 877028 used, 76128 buff/cache
KiB Swap: 0 total, 0 free, 0 used. 4196 avail Mem
scroll coordinates: y = 1/168 (tasks), x = 1/12 (fields)
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
30 root 20 0 0 0 0 S 11.1 0.0 4:04.70 kswapd0
1116 root 20 0 791548 44900 0 S 0.4 4.4 0:14.91 dockerd
1 root 20 0 37752 2664 864 D 0.2 0.3 0:06.00 systemd
Il est difficile de dire ce qui se passe, puisque je n'arrive pas à obtenir beaucoup d'informations (très peu réactif), mais voici ce que je vois :
- charge moyenne très élevée
- Je vois environ 20% - 30% de charge CPU
- Je ne vois pas d'utilisation élevée des IO / du réseau.
- Je ne peux pas identifier les processus qui sont dans la file d'attente d'exécution.
Comment est-il possible d'avoir une moyenne de charge élevée et une faible utilisation du CPU ?