4 votes

Erreurs d'écriture-lecture, récupération Raid1 ?

Cela peut paraître stupide, mais je suis censé pouvoir poser n'importe quelle question ici, tant qu'elle est pertinente.

Alors voilà. J'ai un RAID 1 sur le serveur qui est officiellement sur le point de mourir. Après un chkdsk, les fichiers se corrompent de plus en plus régulièrement, et les choses ont l'air plutôt apocalyptiques de mon point de vue terrifié et pessimiste de "oh-my-god-we're all-gonna-die".

Je suis incapable de lire les fichiers sur le serveur, notamment tout ce qui a été fait ce matin par un collègue a été perdu.

Bon, contexte mis à part, je veux voir si le disque alternatif fonctionne mieux que le disque principal, alors voici mes questions :

Comment savoir lequel est le maître et lequel est l'esclave, comment déterminer lequel est défectueux ?

Lorsque cela est déterminé, que dois-je faire ? Puis-je simplement retirer l'autre disque ? J'ai essayé de le faire (en prenant les précautions nécessaires pour ne pas tuer d'autres matériels), mais j'ai eu un message "broken raid detected, enter setup ?" au démarrage.

Dois-je insérer un autre disque avant de pouvoir récupérer les données ?

Est-ce qu'essayer de démarrer en utilisant un disque ubuntu live est un bon moyen d'essayer de sauvegarder des données ?

J'essaie de faire de mon mieux pour ne pas paniquer, mais quand mon patron a finalement compris ce que je voulais dire par "Nous allons être dans la merde très bientôt", c'était déjà proche de la date prévue, et "bientôt" était à moins d'une semaine de ce moment. Oy vey...

MISE À JOUR : J'ai essayé les SeaTools, comme suggéré ci-dessous, et les deux disques ont échoué au test générique long. Sur une échelle de un à l'infini, à quel point suis-je exactement dans le caca maintenant ?

Si j'ai vraiment, VRAIMENT besoin de récupérer les données, combien d'argent mon patron devra-t-il donner pour y parvenir ? Est-ce même possible ? Je veux dire, j'ai arrêté de croire au Père Noël il y a un moment...

2voto

IceMage Points 1326

Vous devez retirer chaque disque dur et les tester séparément avec un outil comme Seatools.

http://www.seagate.com/www/en-us/support/downloads/seatools

L'un des disques est probablement défectueux, mais avec le RAID1, l'ordinateur n'a aucun moyen de savoir avec certitude quel disque contient de bonnes données et quel disque contient de mauvaises données. Si vous n'avez pas de chance, les deux disques seront défectueux, mais il est plus que probable qu'il ne s'agisse que de l'un d'entre eux.

Dans une configuration RAID 1, il n'y a pas de maître/esclave, les deux disques ne font qu'un et tout est contrôlé par le contrôleur Raid. Pour cette raison, vous voudrez probablement tester les disques dans une autre machine. En outre, si les tests révèlent qu'un disque est défectueux, il vous suffit de retirer l'ancien disque et de le remplacer rapidement. Si vous avez un RAID1, l'ordinateur fonctionnera avec un seul disque.

0 votes

Ce qui signifie, en gros, que je retire un disque, que je ne me soucie pas du message raid cassé et que je teste le disque. Ensuite, je fais la même chose pour l'autre. Le moins cassé des deux gagne le concours ?

0 votes

Oui, exactement. Vous pouvez remplacer le disque plus tard, mais vous devez déterminer lequel est défectueux.

0 votes

Une dernière chose, je ne suggérerais pas d'exécuter chkdsk sur les ordinateurs RAID, il a tendance à faire plus de dégâts que de bien... Utilisez Seatools pour vérifier les disques à la recherche de problèmes, il n'est pas aussi destructeur que chkdsk peut l'être.

2voto

Maximus Minimus Points 8917

En théorie, vous devriez pouvoir retirer un disque d'une matrice miroir pendant que le système fonctionne, et il devrait continuer à fonctionner correctement. J'ai fait cela une fois (par accident, je m'empresse de l'ajouter) et il n'y a pas eu d'effets néfastes (à part la perte d'une des paires de miroirs, bien sûr).

C'est très risqué sur un système actif, donc je recommande de mettre en place un système de remplacement. MAINTENANT Il s'agit de transférer autant de données que possible sur ce serveur, l'ancien serveur étant ensuite mis hors ligne. Le pire que vous puissiez faire est d'attendre qu'il tombe en panne avant d'agir.

Une fois cela fait, vous aurez établi une position où la plupart de votre matériel est opérationnel et disponible pour les utilisateurs. C'est alors - et seulement alors - que vous pourrez commencer à expérimenter avec l'ancienne boîte et voir quelle part du reste vous pouvez récupérer.

Ma suggestion d'ouvrir le disque est une solution - ouvrir un disque en cours de fonctionnement et vérifier les données. Si vous obtenez des corruptions, vous savez que l'autre disque est bon, sinon, vous savez que celui-ci est bon.

Je voudrais vraiment no faire tout ce qui est qui impliquait des redémarrages de ce système, car l'ensemble pouvait ne pas se remettre en marche à tout moment. Si vous avez déjà été dans cette situation, vous savez à quel point c'est désagréable.

0 votes

Vous en voulez plus ? Il n'y a pas de serveur de rechange ou de sauvegarde. Il n'y a pas de réplication. J'agis parce que le patron a décidé qu'une panne de serveur était suffisamment critique pour que je m'en occupe. La boîte du serveur se trouvait dans un placard à balais mal famé, climatisé, à moins de deux pieds de la conduite de gaz principale du bâtiment. Le serveur est tombé en panne à cause d'une erreur de lecture alors que des gens travaillaient - et sauvegardaient - et perdaient - des données sur le serveur. Le bon côté des choses : Il y a moins de 10 employés ici. Et il pourrait très bien y en avoir un de moins d'ici la fin du mois.

1voto

user13993 Points 257

S'agit-il d'un contrôleur RAID matériel ? La plupart d'entre eux disposent d'un utilitaire que vous pouvez utiliser pour vérifier la santé de vos disques et déterminer lesquels sont dégradés. Le fabricant fournira également une procédure recommandée pour remplacer le disque dégradé et reconstruire le miroir.

Cheers

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X