1 votes

Défaillance du disque dur dans le RAID, mais les scans sont bons ?

J'ai eu une panne de disque dur dans mon RAID Linux (lumière rouge clignotante). Je l'ai sorti et au redémarrage j'ai été obligé d'exécuter fsck manuellement et de réparer quelques erreurs dans le système de fichiers restant.

J'essayais de trouver des informations supplémentaires sur la raison de son échec et je l'ai branché sur mon PC Windows. Quand je l'ai branché, j'ai eu un message pour l'initialiser dans le gestionnaire de disques. J'avais prévu d'utiliser CrystalDiskInfo ou HDTune pour obtenir les données S.M.A.R.T.. Il est apparu en vert, mais il y a un compte de 1 sous "Reported Uncorrectable Errors". J'ai décidé de le formater pour obtenir plus d'informations. J'ai fait le format complet, pas rapide et je n'ai pas eu d'erreurs.

J'ai ensuite chargé HDTune et effectué un balayage complet, mais je n'ai trouvé aucun problème. Je sais que ce disque a beaucoup d'heures, mais je suis plus intéressé par le principal du problème. En ignorant les heures, pourquoi ce disque tomberait-il en panne dans le RAID, mais fonctionnerait ensuite normalement ?

Après ces analyses, y a-t-il une raison de ne pas le remettre en service ?

enter image description here

1 votes

Où se trouve le journal des erreurs SMART ? Si cet outil ne vous le montre pas, trouvez-en un autre.

2voto

LeSnip3R Points 1791

Les données SMART contiennent beaucoup d'informations exclusives qui peuvent être difficiles à déchiffrer. Le problème avec les données SMART est qu'à moins que quelque chose ne soit "marqué", il est presque impossible de savoir ce qui se passe réellement avec le disque.

Un lecteur défaillant ne signifie pas nécessairement qu'il aura un statut SMART défectueux.

Il est fort probable que le disque commence à présenter des secteurs défectueux qui sont réaffectés et qui causent des problèmes de synchronisation dans votre RAID. Ou, il y a d'autres problèmes que le pilote RAID détecte - comme des échecs de lecture, des échecs d'écriture ou de longs temps d'accès/de recherche.

Pour répondre à votre question, NON, il ne faut pas faire confiance au lecteur et il ne faut pas le remettre en service. J'ai personnellement constaté ce même comportement à de nombreuses reprises, et chaque fois que j'ai remis le disque en service, il a été rejeté à nouveau en quelques mois. Je ne le fais plus.

En ignorant la possibilité d'un problème de câblage, ou d'un problème de contrôleur RAID / SATA, le disque est mis à la porte parce qu'il a des problèmes. Les disques sont bon marché, et comme le RAID est souvent utilisé dans les systèmes de production, cela ne vaut pas la peine de prendre le risque de perdre deux disques ou plus et vos données.

0 votes

Je n'avais pas envisagé le problème de synchronisation où peut-être le disque ne tourne pas / ne cherche pas aussi vite que les autres à cause de son âge et bien que cela ne serait pas un problème s'il s'agissait d'un disque solitaire, cela peut être un problème dans le cadre du RAID. Je ne lui ferai plus confiance - mais j'avais un tas de disques similaires sur l'étagère et je voulais savoir ce que je pouvais faire pour anticiper les meilleurs disques à utiliser dans la pile.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X