2 votes

Mauvais secteur sur le disque provoque le crash de tout le serveur

Le disque dur de notre serveur dédié a récemment été diagnostiqué avec des secteurs défectueux, et à chaque fois que certaines données sur le disque sont sur le point d'être accédées, tout le serveur devient non-réactif avant que je ne redémarre via le panneau robot.

Nous avons demandé à notre fournisseur de serveur d'installer un nouveau disque dur, ce qu'ils ont fait.

Maintenant je veux tout copier sur le nouveau disque (le vieux disque est toujours attaché), alors je démarre le serveur en mode de secours (amorçage réseau) et exécute la commande suivante sur le serveur amorcé en réseau via SSH (root):

ddrescue -d -f -r3 /dev/sdb /dev/sda /home/ddrescue.log

après environ 5 minutes, le serveur devient non-réactif, et ne répond même pas au SSH (comme si le port était fermé).

Qu'est-ce qui pourrait causer cela? Comment puis-je empêcher le serveur de devenir instable quand certains secteurs défectueux sont sur le point d'être accédés?

1voto

shodanshok Points 42743

Vous devriez essayer d'activer TLER - récupération d'erreurs limitée dans le temps

Sans cela, un disque avec des secteurs défectueux essayera de lire les secteurs affectés pendant plus de 30 secondes, risquant de faire planter tout le sous-système de disque.

0voto

Alastair Irvine Points 142

À en juger par les apparences, votre matériel/pilote/ce qui que ce soit se bloque lorsqu'il rencontre un bloc défectueux et vous ne pouvez pas continuer avec la sauvegarde.

Avez-vous une liste des blocs défectueux ?

Et si vous faisiez une sauvegarde logique (avec tar, par exemple) ?

Ma démarche serait la suivante, mais je ne l'ai pas testée :

  • obtenir d'une manière ou d'une autre une liste des blocs défectueux (fsck.ext4 avec -c ou/et -l) ?
  • ayant la liste des blocs défectueux, trouver les fichiers concernés en utilisant debugfs :
    icheck block ...
          Imprime une liste des inodes qui utilisent un ou plusieurs blocs
          spécifiés en ligne de commande.
  • créer une sauvegarde logique avec tar --exclude...

Bonne chance. :-s

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X