74 votes

SSD ou HDD pour le serveur

Numéro

J'ai lu de nombreuses discussions sur le stockage, et sur la question de savoir si les disques SSD ou les disques durs classiques sont meilleurs. Je suis assez perplexe. Les disques durs sont toujours préférés, mais pourquoi ?

Lequel est le meilleur pour le stockage actif ? Par exemple pour les bases de données, où le disque est actif en permanence ?

A propos de SSD.

Pour.

  • Ils sont silencieux.
  • Pas mécanique.
  • Le plus rapide.

Cons.

  • Plus cher.

Question.

  • Lorsque le cycle de vie d'une cellule d'un SSD est utilisé, que se passe-t-il ensuite ? Le disque est réduit de cette seule cellule et fonctionne normalement ?
  • Quel est le meilleur système de fichiers pour écrire ? Est-ce que ext4 est bon parce qu'il enregistre dans des cellules de façon consécutive ?

À propos du disque dur.

Pour.

  • Moins cher.

Cons.

  • En cas de défaut mécanique, je pense qu'il n'y a généralement aucun moyen de le réparer. (Veuillez confirmer.)
  • Le plus lent, même si je pense que la vitesse du disque dur est généralement suffisante pour les serveurs.

S'agit-il uniquement du prix ? Pourquoi préfère-t-on les disques durs ? Et les disques SSD sont-ils vraiment utiles pour les serveurs ?

99voto

masher Points 1

L'un des aspects de mon travail consiste à concevoir et à construire des systèmes de stockage à grande échelle (souvent appelés "SAN", ou "Storage Area Networks"). En général, nous utilisons une approche à plusieurs niveaux avec des disques SSD et des disques durs combinés.

Cela dit, chacune d'entre elles présente des avantages spécifiques.

  1. Les SSD ont presque toujours un coût par octet plus élevé. Je peux obtenir des disques durs SAS 10k 4kn avec un coût par gigaoctet de 0,068 $/GB USD. Cela signifie que pour environ 280 $, je peux obtenir un disque de 4 To. Les disques SSD, quant à eux, ont généralement un coût par gigaoctet de l'ordre de 10 à 20 cents, voire de dollars par gigaoctet.

  2. Dans le cas d'un système RAID, la vitesse n'est plus aussi importante que la taille et la fiabilité. Je peux construire un système RAID N+2 de 12 To avec des disques durs beaucoup moins chers que des disques SSD. Ceci est principalement dû au point 1.

  3. Lorsqu'ils sont traités correctement, les disques durs sont extrêmement bon marché à remplacer et à entretenir. Le coût par octet étant plus faible, il est moins coûteux de remplacer un disque dur par un autre en cas de panne. De plus, les pannes de disque dur étant généralement liées au temps par rapport aux données écrites, le remplacement d'un disque dur n'entraîne pas automatiquement une consommation de TBW lors de la reconstruction de la matrice RAID. (Je vous l'accorde, le pourcentage de TBW utilisé pour une reconstruction est globalement minime, mais le point est acquis).

  4. Le marché des SSD est relativement complexe. Il existe quatre (actuellement, au moment de la rédaction de ce document) grands types de disques SSD, classés du plus grand nombre d'écritures totales supportées au plus petit : SLC, MLC, TLC, QLC. Le SLC supporte généralement le plus grand nombre d'écritures totales (le principal facteur limitant la durée de vie des SSD), tandis que le QLC supporte généralement le plus petit nombre d'écritures totales.

Cela dit, les systèmes de stockage les plus performants que j'ai vus sont hiérarchisés avec les deux disques utilisés. Personnellement, tous les systèmes de stockage que je recommande à mes clients suivent généralement les niveaux suivants :

  1. Le niveau 1 est généralement un (ou plusieurs) niveau RAID 10 SSD uniquement. Les données sont toujours écrites sur le niveau 1.
  2. Le niveau 2 est généralement un (ou plusieurs) RAID 50 ou 5 SSD uniquement. Les données sont vieillies du niveau 1 au niveau 2.
  3. Le niveau 3 est typiquement un (ou plusieurs) niveau RAID 10 HDD uniquement. Les données sont vieillies du niveau 2 au niveau 3.
  4. Le niveau 4 est généralement constitué de plusieurs groupes de niveaux RAID 6 à disque dur uniquement. Les données sont vieillies du niveau 3 au niveau 4. Nous faisons en sorte que les groupes RAID 6 soient aussi petits que possible, de façon à ce qu'il y ait un support maximal pour les pannes de disque.

Les performances en lecture/écriture diminuent à mesure que l'on augmente les niveaux, les données se propagent vers le bas jusqu'à un niveau où la plupart des données partagent la même fréquence d'accès/modification. (C'est-à-dire que plus les données sont lues/écrites fréquemment, plus le niveau où elles résident est élevé).

Si vous ajoutez un peu de fibre optique bien conçue, vous pouvez créer un réseau de stockage SAN dont le débit est supérieur à celui de l'Europe. embarqué les lecteurs le feraient.

Passons maintenant à certains éléments spécifiques que vous mentionnez :

Vos questions sur les DSS

Comment fonctionne exactement la SSD, quand le cycle de vie d'une cellule est terminé, que se passe-t-il ensuite ? Le disque est réduit par cette seule cellule et fonctionne normalement ? Ou que se passe-t-il alors ?

  • Les deux types de disques sont généralement conçus avec un certain nombre de cellules "de rechange". En d'autres termes, ils disposent d'un espace "supplémentaire" auquel vous ne pouvez pas accéder et qui prend en charge le transfert en cas de défaillance d'une cellule. (Cela signifie que si une seule "cellule" (secteur du disque dur) meurt, une "réserve" est utilisée. Vous pouvez vérifier le statut de ceci via l'utilitaire de diagnostic S.M.A.R.T. sur les deux disques.

Quelle est la meilleure solution (système de fichiers) pour écrire ? Je pense que ext4 est bon, parce qu'il sauvegarde les cellules consécutivement ?

  • Pour les SSD, cela n'a rien à voir. Le positionnement des cellules n'a pas d'importance, car le temps d'accès est généralement linéaire.

Vos questions sur les disques durs

En cas de défaut mécanique, il n'y a aucun moyen de le réparer (est-ce exact) ?

  • Partiellement incorrect. Les disques durs sont en fait plus facile pour récupérer des données dans la plupart des situations de panne. (Note : J'ai dit plus facile no facile .) Un équipement spécialisé est nécessaire, mais les taux de réussite semblent assez élevés. Les plateaux peuvent souvent être lus de le disque dur lui-même par un équipement spécial, qui permet de récupérer les données si le disque est mort.

Le plus lent, mais je pense que la vitesse n'est pas si importante, car la vitesse du disque dur est absolument suffisante pour l'utilisation du serveur ?

  • En général, lorsqu'on utilise le système RAID, la vitesse d'un seul disque devient un facteur moins important, car vous pouvez utiliser des configurations RAID d'appariement de vitesse qui vous permettent d'augmenter la vitesse globale. (Les RAID 0, 5 et 6 sont fréquemment utilisés, souvent en tandem.) Pour une base de données avec des entrées-sorties élevées, les disques durs ne sont généralement pas suffisants, à moins qu'ils ne soient conçus de manière à ce qu'ils puissent être utilisés comme des disques durs. très délibérément. Vous voudriez des disques SSD SLC à forte intensité d'écriture pour des entrées-sorties de niveau base de données.

17voto

Chopper3 Points 99341

Le disque dur est toujours préféré

C'est ça ? Je ne suis pas sûr que ça le soit pour être honnête.

Les disques durs sont disponibles dans de grandes tailles pour un prix raisonnable, c'est indéniable, et je pense que les gens leur font confiance pour une rétention des données plus longue que celle des disques SSD. De plus, lorsque les disques SSD meurent, ils ont tendance à mourir complètement, d'un seul coup, alors que les disques durs ont tendance à mourir d'une manière plus prévisible, ce qui laisse peut-être plus de temps pour récupérer les données si nécessaire.

Mais sinon, les SSD sont la solution pour la plupart des utilisations - vous voulez une paire de disques de démarrage, quelques SATA de 500 Go dans R1 ne coûteront pas un clou, pour l'utilisation de la base de données, vous ne pouvez pas vraiment battre les SSD (tant que vos journaux sont sur des modèles de haute endurance). Pour les sauvegardes, vous pouvez utiliser de gros disques durs de 7,2k, de même pour les très grands ensembles de données (en fait, j'ai acheté plus de 4 000 disques durs de 10 To au début de l'année dernière pour répondre à ce seul besoin), mais sinon, les SSD sont la solution.

7voto

John Mahowald Points 28597

L'état solide pour tout ce qui est chaud : utilisation interactive, bases de données, tout ce qui est en ligne. Les broches comme stockage chaud bon marché, uniquement pour les archives pas trop froides ou les données rarement consultées. En particulier, les disques durs dans une zone de transit avant que les sauvegardes ne soient archivées sur bande.

Des types de médias différents pour le chaud et le froid contribuent également à une certaine diversité. Un défaut de perte de données dans une marque de contrôleur SSD serait bien pire s'il emportait à la fois les données en ligne et les données de sauvegarde. C'est peu probable, mais les broches et les bandes sont de toute façon bon marché, alors pourquoi prendre le risque ?

Le mode de défaillance d'un dispositif particulier n'est pas important, tant que les matrices restent redondantes et sauvegardées. En général, la procédure consiste à remplacer un lecteur présentant des symptômes de défaillance. Essayez de les réparer dans vos systèmes de test, où toute défaillance catastrophique n'a pas d'impact sur les services de production.

Le système de fichiers est une question de préférence personnelle. Bien qu'il existe des systèmes de fichiers optimisés pour les SSD, un système que vous connaissez et que vous pouvez réparer est peut-être plus important.

6voto

Joe Points 1165

Le grand avantage d'un SSD est sa vitesse et sa fiabilité. Cependant, l'un des sales petits secrets est le nombre limité de cycles d'écriture dont dispose un SSD. Si vous construisez un serveur qui a beaucoup d'activité d'écriture sur le disque dur, comme une base de données ou un serveur de courrier électronique, vous aurez besoin d'un SSD plus cher qui a une plus grande endurance.

Les Flash NAND sont de 3 types

  • TLC
  • MLC
  • SLC

TLC est principalement conçu pour les serveurs web ou les serveurs d'archives qui ont peu de cycles d'écriture. MLC est destiné aux serveurs qui ont un mélange de cycles de lecture et d'écriture comme les serveurs de base de données à faible volume. SLC est conçu pour les serveurs qui ont beaucoup de cycles de lecture/écriture comme un serveur de base de données à haut volume.

Le principal facteur déterminant entre les disques SSD et les disques durs est l'application et le budget. Dans un monde parfait, les disques durs SLC SSD rendraient les disques durs standard obsolètes, mais nous n'en sommes pas encore là.

4voto

ahriman Points 11

Le disque dur est toujours préféré, mais pourquoi ?

Cela dépend de votre interlocuteur, de son expérience (gestion, informatique, ventes, etc.) et du type de serveur sur lequel porte la discussion. Les disques durs sont généralement un ordre de grandeur moins chers par octet, mais ils consomment plus d'énergie et sont presque toujours plus lents, en fonction de la charge de travail.

Il s'agit presque toujours d'une question de coût et de la quantité d'espace de stockage que l'on peut faire entrer dans un nombre donné de serveurs. Si vous pouvez obtenir les performances d'une matrice raid à 5 disques avec un seul SSD, le SSD est probablement beaucoup moins cher et utilise une fraction de l'énergie, mais vous obtiendrez aussi peut-être 1/10 du stockage.

Lequel est le meilleur pour le stockage actif ?

C'est là que les choses se compliquent, et c'est la raison pour laquelle de nombreuses personnes préfèrent ne pas se compliquer la vie et se contenter des disques durs qu'elles connaissent.

Les disques durs SSD existent en différentes catégories, avec des limites quant à la quantité de données pouvant être écrites sur les cellules, ce qui n'est PAS la même chose que la quantité de données écrite par l'hôte. L'écriture de petites quantités de données se traduit par l'écriture de grandes quantités de données dans les cellules, c'est ce qu'on appelle l'amplification de l'écriture, et cela peut rapidement tuer les disques ayant une faible endurance.

Les cellules SSD sont nommées en fonction du nombre de bits qu'elles peuvent stocker. Pour stocker n bits, il faut 2^n niveaux de tension par cellule. Un TLC (triple bit) a besoin de 8 niveaux de tension pour adresser ces bits. En général, chaque fois que vous augmentez le nombre de bits par cellule, vous obtenez une baisse de 3 à 10 fois de la durabilité de la cellule. Pour ejemplo Un lecteur SLC peut écrire sur toutes les cellules 100000 fois avant que les cellules ne meurent, une entreprise eMLC 30000 fois, MLC 10000, TLC 5000, QLC 1000.

La technologie des cellules SSD s'est également améliorée d'une génération à l'autre : une meilleure lithographie et la technologie 3D NAND améliorent la densité et les performances par rapport à l'ancienne technologie 2D NAND. "La technologie MLC d'aujourd'hui est meilleure que la SLC d'hier", a déclaré un analyste. Jim Handy .

En fait, les SSD n'écrivent pas directement dans les cellules adressées, mais dans des blocs de cellules. De cette façon, le bloc a une quantité plus constante d'écritures de cellules, et lorsque les cellules sortent de la tolérance, le bloc entier est marqué comme mauvais, et les données sont déplacées vers un nouveau bloc. L'endurance d'un SSD dépend du type de cellule, du nombre de blocs de rechange disponibles, de la charge de correction des erreurs et de la façon dont le disque utilise la mise en cache et les algorithmes pour réduire l'amplification de l'écriture. La tolérance choisie par le fabricant pour marquer les blocs défectueux entre également en ligne de compte. Un disque d'entreprise marquera les blocs défectueux plus tôt qu'un disque grand public, même si l'un ou l'autre est encore pleinement fonctionnel.

Les disques durs SSD "high-write" de qualité professionnelle sont basés sur des cellules SLC ou eMLC et disposent d'un grand nombre de blocs de réserve. Ils possèdent généralement un grand cache avec des condensateurs pour garantir que le cache peut être vidé sur le disque en cas de coupure de courant.

Ils coûtent moins cher par octet au prix d'une endurance réduite, avec des types de cellules différents, moins de surface de réserve, etc. Ils peuvent n'avoir que 5 % de l'endurance d'un disque à "haute écriture", mais ils n'en ont pas besoin lorsqu'ils sont utilisés correctement.

Par exemple, pour une base de données, où le disque est actif en permanence ?

Ma base de données est petite, avec des lectures intermittentes représentant 95 % des accès, et la majeure partie est mise en cache dans la RAM, elle est presque aussi rapide sur un disque dur que sur un SSD. Si elle était plus importante, il n'y aurait pas assez de RAM sur le système, et le SSD commence à faire une énorme différence dans les temps d'accès.

Les disques SSD accélèrent également les sauvegardes et les restaurations de plusieurs ordres de grandeur. Ma base de données a été restaurée à partir d'une sauvegarde en 10 minutes environ sur un SSD lent, soit à peu près 11 secondes à un très rapide, la sauvegarde sur un disque dur aurait pris environ 25 minutes. Cela représente au moins deux ordres de grandeur, et cela peut faire une énorme différence en fonction de la charge de travail. Il peut littéralement s'amortir dès le premier jour.

Les bases de données avec d'énormes quantités de petites écritures peuvent tuer un disque TLC de qualité grand public en quelques heures.

Et les SSD sont-ils vraiment utiles pour les serveurs ?

Absolument, si le type et la qualité de l'entraînement sont sélectionnés pour l'application, si vous vous y prenez mal, cela peut être un désastre.

Mon serveur gère plusieurs bases de données, plus un stockage réseau à lecture élevée, plus un stockage de séquences de sécurité à écriture élevée, plus un stockage de fichiers à lecture et écriture mixtes et une sauvegarde client. Le serveur dispose d'une matrice RAID-6 de disques durs pour le stockage réseau et le NVR, d'un seul SSD MLC haute performance pour MySQL, et de 3 disques TLC grand public en RAID-5 pour les sauvegardes des clients et des bases de données et le stockage réseau à accès rapide.

La vitesse d'écriture sur le RAID SSD est à peu près la même que celle du RAID HDD, mais la vitesse de lecture à accès aléatoire est plus de 10 fois plus rapide sur le RAID SSD. Encore une fois, il s'agit d'un SSD TLC grand public, mais comme la vitesse d'écriture séquentielle est environ 3 fois plus rapide que celle du LAN gigabit, il n'est jamais surchargé, et il y a beaucoup de surcharge si le système effectue des sauvegardes locales lorsqu'il est accessible à distance.

La plupart des SSD offrent également effacement sécurisé instantané (ISE) Seuls quelques disques durs de qualité professionnelle proposent l'ISE, mais ils sont de plus en plus courants. Cette fonction est très utile si vous mettez un disque à la retraite ou si vous le réutilisez.

Quelle est la meilleure solution (système de fichiers) pour écrire ?

Cela dépend du type de données et des types de fonctionnalités du système de fichiers que vous souhaitez. Je n'utilise que EXT4 et BTRFS (j'ai besoin de snapshots et de checksums). La surcharge du système de fichiers diminue l'espace utilisable et peut réduire légèrement la durée de vie des SSD, BTRFS a une surcharge élevée pour les sommes de contrôle et d'autres fonctions, et les instantanés utilisent beaucoup d'espace.

En cas de défaut mécanique, il n'y a aucun moyen de le réparer (est-ce exact) ?

Quel que soit le type de disque, avez-vous déjà eu à récupérer des données sur un disque mort ? Cela peut être très cher Si vous avez besoin de plus d'espace, il est préférable d'avoir une sauvegarde à plusieurs niveaux, RAID sur le stockage principal, des sauvegardes versionnées localement sur un autre appareil ou une autre machine, puis une synchronisation hors site ou dans le nuage. 1 To de stockage en nuage coûte 5 $ par mois, la récupération des données sur un disque dur peut vous coûter 2 000 $, et un SSD mort peut être impossible à récupérer... faites simplement les sauvegardes et oubliez les réparations.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X