1 votes

Xfs_repair est bloqué - est-il sûr de le tuer ?

Centos 6.9

Donc, j'ai eu deux volumes de 40 To qui ont échoué, du moins nominalement, après avoir reconfiguré le raid auquel ils appartiennent. Les volumes raid vont bien, mais lors de leur montage, l'un a signalé "ne peut pas lire le superbloc", l'autre "mauvais type de système de fichiers, mauvaise option, mauvais superbloc".

J'ai ensuite commis l'erreur de lancer xfs_repair sur les deux en même temps (ils sont sur le même serveur de fichiers), ce que je comprends maintenant était demander des problèmes de mémoire. Le serveur de fichiers dispose de 64 Go de RAM avec la moitié de swap. Le serveur a donc manqué de mémoire et l'un des processus xfs_repair a été tué. Maintenant, le second est toujours en cours d'exécution, mais il est bloqué depuis un certain temps sans aucun progrès et une utilisation du processeur à 0%.

Je pense devoir tuer le processus xfs_repair bloqué, mais cela me rend nerveux. Y a-t-il autre chose que je pourrais essayer ?

Quant à l'autre volume qui était en cours de réparation et dont le processus a été tué, j'ai essayé de le monter et il se monte correctement maintenant.

Merci pour tout conseil.

1voto

Gareth Butcher Points 1713

Généralement, il n'est pas sûr de tuer un processus effectuant une manipulation de bas niveau. Dans votre cas cependant, vous avez un filet de sécurité car l'autre lecteur fonctionne.

En supposant qu'il s'agit de deux volumes configurés en RAID 1, vous pouvez maintenant démonter celui qui fonctionne (juste pour plus de sécurité), tuer le processus xfs_repair et évaluer l'état de celui qui a été interrompu, puis simplement restaurer le bon (démonté plus tôt) s'il ne fonctionne pas.

Étant donné que le processus est à 0% d'utilisation, il est probablement bloqué, ce qui signifie qu'il doit être arrêté et cela serait le cas même s'il était sûr ou non. Un arrêt ou un redémarrage le tueraient implicitement de toute façon, donc je vous suggère de le faire vous-même, pour avoir plus de contrôle sur ce qui se passe. Si quelque chose de mauvais se produit, cela s'est probablement déjà produit ou était inévitable.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X