45 votes

Comment dois-je graver des disques durs?

Google a réalisé une étude très approfondie sur les défaillances des disques durs qui a révélé qu'une partie importante des disques durs tombent en panne dans les premiers 3 mois d'utilisation intensive.

Mes collègues et moi envisageons de mettre en place un processus de préchauffage pour tous nos nouveaux disques durs qui pourrait potentiellement nous éviter bien des tracas en évitant de perdre du temps sur de nouveaux disques non testés. Avant de mettre en place un processus de préchauffage, nous aimerions obtenir des avis de personnes plus expérimentées :

  • À quel point est-il important de préchauffer un disque dur avant de commencer à l'utiliser ?
  • Comment mettez-vous en place un processus de préchauffage ?
    • Combien de temps faites-vous préchauffer un disque dur ?
    • Quel logiciel utilisez-vous pour préchauffer les disques ?
  • Combien de stress est trop pour un processus de préchauffage ?

ÉDIT : En raison de la nature de l'activité, les RAIDs sont impossibles à utiliser la plupart du temps. Nous devons nous appuyer sur des disques uniques qui sont souvent envoyés à travers le pays. Nous sauvegardons les disques dès que possible, mais nous rencontrons quand même des pannes de temps en temps avant d'avoir une chance de sauvegarder les données.

MISE À JOUR

Ma société a mis en place un processus de préchauffage depuis un moment maintenant, et il s'est avéré extrêmement utile. Nous préchauffons immédiatement tous les nouveaux disques que nous recevons en stock, ce qui nous permet de trouver de nombreuses erreurs avant l'expiration de la garantie et avant de les installer dans de nouveaux systèmes informatiques. Il s'est également avéré utile pour vérifier qu'un disque est défectueux. Lorsqu'un de nos ordinateurs commence à rencontrer des erreurs et qu'un disque dur est le principal suspect, nous relançons le processus de préchauffage sur ce disque et examinons les erreurs pour nous assurer que le disque était effectivement le problème avant de commencer le processus de RMA ou de le jeter à la poubelle.

Notre processus de préchauffage est simple. Nous avons un système Ubuntu désigné avec de nombreux ports SATA, et nous exécutons badblocks en mode lecture/écriture avec 4 passes sur chaque disque. Pour simplifier les choses, nous avons écrit un script qui affiche un avertissement "LES DONNÉES SERONT EFFACÉES DE TOUS VOS DISQUES" puis lance badblocks sur chaque disque, sauf le disque système.

15 votes

Curieusement, pourquoi envoyez-vous les disques à travers le pays? Il semble que vous avez plus de chances de rencontrer une défaillance de disque en raison d'une perte de choc et de manipulation générale par le service postal que pour des raisons qu'un burn-in détecterait.

0 votes

Est-ce que ces disques finissent dans des serveurs ou des ordinateurs de bureau ?

0 votes

Pourquoi ne pas opter pour une paire de connexions Internet très haut débit et un outil de duplication des données (par exemple, rsync) ? Si vous avez besoin de sécurité, SSH fera l'affaire. Et pourquoi ne pas opter pour un ensemble de disques Blu-ray quad-couche de 128 Go ou des SSD ? Je pense juste que vous pourriez utiliser un processus non optimal en premier lieu si vous avez vraiment besoin d'envoyer fréquemment des disques durs par la poste. Je ne trouve pas de cas d'utilisation valide où l'envoi de disques durs est la solution optimale. Et l'étude de Google serait trompeuse dans votre cas d'utilisation, car leur étude ne concernait pas les cas où les disques sont fréquemment envoyés par la poste.

3voto

voretaq7 Points 78924

À quel point est-il important de faire un rodage d'un disque dur avant de commencer à l'utiliser?

Cela dépend.
Si vous l'utilisez dans un système RAID offrant une redondance (1, 5, 6, 10)? Pas tellement.
Si vous l'utilisez en standalone? Un peu, mais il vaut mieux simplement exécuter smartd ou quelque chose pour le surveiller à la place, du moins à mon avis.

Cela mène naturellement à ma réponse à "Comment mettez-vous en place un processus de rodage?" -- Je ne le fais pas.
Au lieu d'essayer de "rodé" les disques, je les utilise en paires redondantes et j'utilise une surveillance prédictive (comme SMART) pour me dire lorsque qu'un disque commence à dysfonctionner. J'ai constaté que le temps supplémentaire nécessaire pour faire une pleine rodage (en exerçant vraiment tout le disque) est nettement plus coûteux que de faire face à une défaillance de disque et de le remplacer.
En combinant RAID et de bonnes sauvegardes, vos données devraient être très sécurisées, même en cas de mortalité infantile (ou à l'autre extrémité de la courbe en baignoire où vous commencez à avoir des disques mourir de vieillesse)

1 votes

Que se passe-t-il si le lecteur ne peut pas être surveillé car il n'est pas à un endroit constant? :)

2 votes

@jsmith - alors vous le faites vous envoyer des notifications plutôt que de le sonder depuis un hôte de surveillance -- il y a presque aucune situation où vous ne pouvez véritablement ne pas surveiller quelque chose, il suffit juste d'un peu de créativité :)

2voto

Charlie Points 181

Spinrite (grc.com) lira et écrira de nouveau toutes les données sur le disque. C'est une bonne chose à faire pour un nouveau disque même si vous n'essayez pas de le faire échouer. Cela prend beaucoup de temps pour s'exécuter au niveau 4, généralement quelques jours pour les lecteurs de taille actuelle. Je devrais également ajouter que c'est non destructif. En fait, s'il y a des données dans de mauvais endroits, il les déplacera et les récupérera. Bien sûr, vous ne l'exécuteriez jamais sur un SSD.

1voto

Thomas Sisson Points 492

Je suis sûr qu'un contrôle hebdomadaire et une vérification des erreurs suffiront pour "roder" les disques durs. Bien que depuis votre publication je n'ai jamais entendu parler d'une telle chose.

Cité de "6_6_6" sur Storagereview.com

  1. Connectez le disque à un système en marche. Lire les valeurs SMART.
  2. Faites un test SMART court. Faites un test SMART long.
  3. Remplissez de zéros / Effacez le disque avec l'utilitaire du fabricant. Disque entier.
  4. Exécutez HDTach en lecture/écriture complète. Everest / Sandra, etc. ont tous des tests de stress. Faites fonctionner la partie du disque dur en continu pendant des heures.
  5. Exécutez Victoria pour le test de lecture/écriture sous Windows et assurez-vous qu'il n'y a pas de secteurs défectueux.
  6. Basculez en mode DOS. Exécutez MHDD, faites un test LBA et vérifiez les secteurs lents. Faites un test de lecture/écriture/vérification. Exécutez la commande d'effacement ATA sécurisé interne du disque.
  7. Faites un formatage complet.
  8. Comparez les valeurs SMART. S'il n'y a pas d'anomalies, tout est bon. Installez votre OS et continuez.

En somme, je pense personnellement que c'est une mauvaise idée.

Source: http://forums.storagereview.com/index.php/topic/27398-new-hdd-burn-in-routines/

0voto

Tout d'abord, je suis d'accord avec les autres afficheurs que votre cas d'utilisation suggère que les lecteurs de bandes seront la meilleure option.

Si cela n'est pas possible, si vous devez faire voler des lecteurs à travers le pays, un vrai RAID ne semble pas être une option, car vous devrez faire transporter beaucoup plus de lecteurs, augmentant le risque de défaillance. Cependant, que diriez-vous d'un schéma de mise en miroir simple, en envoyant un lecteur et en gardant l'autre sur le site source ?

Ensuite, si le lecteur tombe en panne à l'arrivée, une nouvelle copie peut être faite et envoyée. Si le lecteur est bon à l'arrivée, le lecteur de rechange peut alors être réutilisé - soit pour l'envoi, soit pour sauvegarder les données originales.

0voto

RichVel Points 3524

Vous n'avez pas vraiment expliqué pourquoi les disques sont expédiés - est-ce simplement une manière d'envoyer des données, ont-ils des applications complètes/images d'OS prêtes à être lancées sur un PC, ou autre chose?

Je suis d'accord avec les autres réponses selon lesquelles RAID ou les sauvegardes sont meilleurs que la numérisation, en raison des risques de l'expédition d'un disque entraînant des problèmes mécaniques.

Une façon plus générale de le dire serait de "s'appuyer sur des données redondantes pour détecter et corriger les erreurs" - expédiez soit 2 disques pour chaque ensemble de données, soit des données redondantes sur un seul disque. Quelque chose comme Parchive vous permet d'ajouter un niveau défini de redondance aux données, permettant une récupération même si une grande partie des données est corrompue. Comme les disques sont assez bon marché de nos jours, il est souvent moins cher d'acheter un disque plus grand que strictement nécessaire que de scanner le disque, d'expédier un disque de remplacement, ou d'expédier 2 disques.

Cela protégerait contre les pannes non catastrophiques du disque - cependant il est toujours préférable de ne pas réutiliser un disque expédié sauf pour l'expédition, comme suggéré précédemment, c'est-à-dire le considérer comme une bande qui doit être extraite vers un disque "réel" qui est installé de manière permanente et n'est expédié nulle part.

Cela devrait vous permettre d'expédier une grande quantité de données (ou même des images d'application/OS) et de réduire l'impact des erreurs de disque à un niveau économiquement viable.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X