Avoir une instance AWS EC2 en cours d'exécution Discours pendant plusieurs années.
Depuis quelques semaines/mois, il arrive qu'après certaines mises à jour de Discourse (via l'interface graphique web de Discourse), le système se bloque. Il n'est alors plus joignable via SSH et même pas via la connexion web SSH de EC2.
J'ai habituellement redémarré l'ensemble de la machine via le panneau d'administration Web d'AWS ECS et j'ai pu me connecter à nouveau, à la fois via SSH et HTTPS.
(Je n'ai pas approfondi la cause de ce problème, malheureusement).
Aujourd'hui, le système s'est à nouveau bloqué après une mise à jour de Discourse.
Mais cette fois, aucun redémarrage ou quoi que ce soit d'autre n'a aidé. Le système reste inaccessible via SSH, même après plusieurs heures d'attente.
La surveillance de l'EC2 ne montre pas non plus de charge élevée du serveur :
Ma question
Comment puis-je accéder à nouveau via SSH à l'instance EC2 Ubuntu ?
Mise à jour 1
Après un nouveau redémarrage et un certain temps d'attente, le système est de retour, de nouveau sorti de nulle part.
Pour moi, il semble que le disque a suffisamment d'espace libre (le manque d'espace disque était l'une de mes hypothèses pour expliquer pourquoi le système était inaccessible).
Filesystem Size Used Avail Use% Mounted on
udev 2.0G 0 2.0G 0% /dev
tmpfs 394M 876K 393M 1% /run
/dev/xvda1 97G 31G 67G 31% /
tmpfs 2.0G 0 2.0G 0% /dev/shm
tmpfs 5.0M 0 5.0M 0% /run/lock
tmpfs 2.0G 0 2.0G 0% /sys/fs/cgroup
/dev/loop1 18M 18M 0 100% /snap/amazon-ssm-agent/1566
/dev/loop0 98M 98M 0 100% /snap/core/10185
/dev/loop2 29M 29M 0 100% /snap/amazon-ssm-agent/2012
/dev/loop3 98M 98M 0 100% /snap/core/10126
overlay 97G 31G 67G 31% /var/lib/docker/overlay2/5a799ab040002ad2ddec94ae85bcbe987543651a0d9478ddc12ab12715da7340/merged
tmpfs 394M 0 394M 0% /run/user/1000
J'essaie maintenant de savoir s'il existe des journaux indiquant la raison de cette panne.
Mise à jour 2
A la demande de heynnema, voici le résultat complet de sudo cat /etc/netplan/*.yaml
:
# This file is generated from information provided by
# the datasource. Changes to it will not persist across an instance.
# To disable cloud-init's network configuration capabilities, write a file
# /etc/cloud/cloud.cfg.d/99-disable-network-config.cfg with the following:
# network: {config: disabled}
network:
version: 2
ethernets:
eth0:
dhcp4: true
match:
macaddress: 06:a0:68:ea:54:4e
set-name: eth0