Le disque dur est toujours préféré, mais pourquoi ?
Cela dépend de votre interlocuteur, de son expérience (gestion, informatique, ventes, etc.) et du type de serveur sur lequel porte la discussion. Les disques durs sont généralement un ordre de grandeur moins chers par octet, mais ils consomment plus d'énergie et sont presque toujours plus lents, en fonction de la charge de travail.
Il s'agit presque toujours d'une question de coût et de la quantité d'espace de stockage que l'on peut faire entrer dans un nombre donné de serveurs. Si vous pouvez obtenir les performances d'une matrice raid à 5 disques avec un seul SSD, le SSD est probablement beaucoup moins cher et utilise une fraction de l'énergie, mais vous obtiendrez aussi peut-être 1/10 du stockage.
Lequel est le meilleur pour le stockage actif ?
C'est là que les choses se compliquent, et c'est la raison pour laquelle de nombreuses personnes préfèrent ne pas se compliquer la vie et se contenter des disques durs qu'elles connaissent.
Les disques durs SSD existent en différentes catégories, avec des limites quant à la quantité de données pouvant être écrites sur les cellules, ce qui n'est PAS la même chose que la quantité de données écrite par l'hôte. L'écriture de petites quantités de données se traduit par l'écriture de grandes quantités de données dans les cellules, c'est ce qu'on appelle l'amplification de l'écriture, et cela peut rapidement tuer les disques ayant une faible endurance.
Les cellules SSD sont nommées en fonction du nombre de bits qu'elles peuvent stocker. Pour stocker n bits, il faut 2^n niveaux de tension par cellule. Un TLC (triple bit) a besoin de 8 niveaux de tension pour adresser ces bits. En général, chaque fois que vous augmentez le nombre de bits par cellule, vous obtenez une baisse de 3 à 10 fois de la durabilité de la cellule. Pour ejemplo Un lecteur SLC peut écrire sur toutes les cellules 100000 fois avant que les cellules ne meurent, une entreprise eMLC 30000 fois, MLC 10000, TLC 5000, QLC 1000.
La technologie des cellules SSD s'est également améliorée d'une génération à l'autre : une meilleure lithographie et la technologie 3D NAND améliorent la densité et les performances par rapport à l'ancienne technologie 2D NAND. "La technologie MLC d'aujourd'hui est meilleure que la SLC d'hier", a déclaré un analyste. Jim Handy .
En fait, les SSD n'écrivent pas directement dans les cellules adressées, mais dans des blocs de cellules. De cette façon, le bloc a une quantité plus constante d'écritures de cellules, et lorsque les cellules sortent de la tolérance, le bloc entier est marqué comme mauvais, et les données sont déplacées vers un nouveau bloc. L'endurance d'un SSD dépend du type de cellule, du nombre de blocs de rechange disponibles, de la charge de correction des erreurs et de la façon dont le disque utilise la mise en cache et les algorithmes pour réduire l'amplification de l'écriture. La tolérance choisie par le fabricant pour marquer les blocs défectueux entre également en ligne de compte. Un disque d'entreprise marquera les blocs défectueux plus tôt qu'un disque grand public, même si l'un ou l'autre est encore pleinement fonctionnel.
Les disques durs SSD "high-write" de qualité professionnelle sont basés sur des cellules SLC ou eMLC et disposent d'un grand nombre de blocs de réserve. Ils possèdent généralement un grand cache avec des condensateurs pour garantir que le cache peut être vidé sur le disque en cas de coupure de courant.
Ils coûtent moins cher par octet au prix d'une endurance réduite, avec des types de cellules différents, moins de surface de réserve, etc. Ils peuvent n'avoir que 5 % de l'endurance d'un disque à "haute écriture", mais ils n'en ont pas besoin lorsqu'ils sont utilisés correctement.
Par exemple, pour une base de données, où le disque est actif en permanence ?
Ma base de données est petite, avec des lectures intermittentes représentant 95 % des accès, et la majeure partie est mise en cache dans la RAM, elle est presque aussi rapide sur un disque dur que sur un SSD. Si elle était plus importante, il n'y aurait pas assez de RAM sur le système, et le SSD commence à faire une énorme différence dans les temps d'accès.
Les disques SSD accélèrent également les sauvegardes et les restaurations de plusieurs ordres de grandeur. Ma base de données a été restaurée à partir d'une sauvegarde en 10 minutes environ sur un SSD lent, soit à peu près 11 secondes à un très rapide, la sauvegarde sur un disque dur aurait pris environ 25 minutes. Cela représente au moins deux ordres de grandeur, et cela peut faire une énorme différence en fonction de la charge de travail. Il peut littéralement s'amortir dès le premier jour.
Les bases de données avec d'énormes quantités de petites écritures peuvent tuer un disque TLC de qualité grand public en quelques heures.
Et les SSD sont-ils vraiment utiles pour les serveurs ?
Absolument, si le type et la qualité de l'entraînement sont sélectionnés pour l'application, si vous vous y prenez mal, cela peut être un désastre.
Mon serveur gère plusieurs bases de données, plus un stockage réseau à lecture élevée, plus un stockage de séquences de sécurité à écriture élevée, plus un stockage de fichiers à lecture et écriture mixtes et une sauvegarde client. Le serveur dispose d'une matrice RAID-6 de disques durs pour le stockage réseau et le NVR, d'un seul SSD MLC haute performance pour MySQL, et de 3 disques TLC grand public en RAID-5 pour les sauvegardes des clients et des bases de données et le stockage réseau à accès rapide.
La vitesse d'écriture sur le RAID SSD est à peu près la même que celle du RAID HDD, mais la vitesse de lecture à accès aléatoire est plus de 10 fois plus rapide sur le RAID SSD. Encore une fois, il s'agit d'un SSD TLC grand public, mais comme la vitesse d'écriture séquentielle est environ 3 fois plus rapide que celle du LAN gigabit, il n'est jamais surchargé, et il y a beaucoup de surcharge si le système effectue des sauvegardes locales lorsqu'il est accessible à distance.
La plupart des SSD offrent également effacement sécurisé instantané (ISE) Seuls quelques disques durs de qualité professionnelle proposent l'ISE, mais ils sont de plus en plus courants. Cette fonction est très utile si vous mettez un disque à la retraite ou si vous le réutilisez.
Quelle est la meilleure solution (système de fichiers) pour écrire ?
Cela dépend du type de données et des types de fonctionnalités du système de fichiers que vous souhaitez. Je n'utilise que EXT4 et BTRFS (j'ai besoin de snapshots et de checksums). La surcharge du système de fichiers diminue l'espace utilisable et peut réduire légèrement la durée de vie des SSD, BTRFS a une surcharge élevée pour les sommes de contrôle et d'autres fonctions, et les instantanés utilisent beaucoup d'espace.
En cas de défaut mécanique, il n'y a aucun moyen de le réparer (est-ce exact) ?
Quel que soit le type de disque, avez-vous déjà eu à récupérer des données sur un disque mort ? Cela peut être très cher Si vous avez besoin de plus d'espace, il est préférable d'avoir une sauvegarde à plusieurs niveaux, RAID sur le stockage principal, des sauvegardes versionnées localement sur un autre appareil ou une autre machine, puis une synchronisation hors site ou dans le nuage. 1 To de stockage en nuage coûte 5 $ par mois, la récupération des données sur un disque dur peut vous coûter 2 000 $, et un SSD mort peut être impossible à récupérer... faites simplement les sauvegardes et oubliez les réparations.