54 votes

Quel est l'état actuel (2016) des SSD en RAID?

Il existe de nombreuses ressources disponibles en ligne qui traitent de l'utilisation des disques SSD dans des configurations RAID - cependant, la plupart de ces ressources remontent à quelques années, et l'écosystème des SSD évolue très rapidement - juste au moment où nous attendons la sortie du produit "Optane" d'Intel plus tard cette année qui va tout changer… encore une fois.

Je vais introduire ma question en affirmant qu'il y a une différence qualitative entre les SSD grand public (par exemple, Intel 535) et les SSD de qualité datacenter (par exemple, Intel DC S3700).

Ma principale préoccupation concerne le support de TRIM dans les scénarios RAID. À ma connaissance, malgré le fait que cela fait plus de 6 ans que les SSD ont été introduits dans les ordinateurs grand public et 4 ans que NVMe est disponible commercialement - les contrôleurs RAID modernes ne prennent toujours pas en charge l'émission de commandes TRIM aux SSD connectés - à l'exception des contrôleurs RAID d'Intel en mode RAID-0.

Je suis surpris que le support de TRIM ne soit pas présent en mode RAID-1, étant donné la façon dont les disques se reflètent mutuellement, cela semble simple. Mais je m'égare.

Je note que si vous souhaitez une tolérance aux pannes avec des disques (HDD et SSD), vous les utiliseriez dans une configuration RAID - mais comme les SSD seraient sans TRIM, cela signifie qu'ils souffriraient d'une amplification d'écriture qui entraîne une usure supplémentaire, ce qui à son tour pourrait causer une défaillance prématurée des SSD - c'est une ironie malheureuse : un système conçu pour protéger contre la défaillance du disque pourrait finir par en résulter directement.

Alors :

  • Le support de TRIM est-il nécessaire pour les SSD modernes (ère 2015-2016)?
    • Y a-t-il une différence dans le besoin de support de TRIM entre les SSD SATA, SATA-Express et NVMe?
  • Les disques sont souvent annoncés comme ayant une collecte de déchets intégrée améliorée; est-ce que cela obvie à la nécessité de TRIM? Comment fonctionne leur processus de GC dans les environnements RAID?
  • Beaucoup d'articles et de discussions des années précédentes portent sur flash SLC vs MLC et que le SLC est préférable en raison de sa durée de vie beaucoup plus longue - cependant, il semble que tous les SSD aujourd'hui (indépendamment de leur position sur le spectre du grand public à l'entreprise) sont MLC de nos jours - cette distinction est-elle encore pertinente?
    • Et le flash TLC?
  • Les SSD d'entreprise ont tendance à avoir une endurance / des limites d'écriture beaucoup plus élevées (souvent mesurées en combien de fois vous pouvez écrire complètement sur le disque en une journée, tout au long de la durée de vie attendue du disque de 5 ans) - si leur limite de cycle d'écriture est très élevée (par exemple, 100 écritures complètes par jour), cela signifie-t-il qu'ils n'ont pas besoin de TRIM du tout car ces limites sont si élevées, ou - au contraire - ces limites ne sont-elles atteignables qu'en utilisant TRIM?

6 votes

Tandis que je ne peux pas répondre à votre question, je pense qu'elle devrait être considérée à la lumière du fait que notre industrie essaie de se débarrasser des RAID propriétaires, les fournisseurs de cloud public utilisent tous maintenant des SSD pour les services de calcul et de stockage, ils ont sûrement résolu cela avec des logiciels, du codage d'effacement, etc. Les innovations en informatique en nuage ont exposé des choses comme le RAID matériel, le Cisco IOS et des réseaux de stockage propriétaires comme des commodités inutiles se développant en haut de la chaîne alimentaire et entravant en réalité l'innovation. Le RAID matériel ne peut pas être vendu à grande échelle (à AWS, Azure, CERN) donc...

0 votes

@Sum1sAdmin Les fournisseurs de cloud public utilisent maintenant tous des SSD sur les services de calcul et de stockage Est-ce que vous dites qu'AWS ou BlackBlaze stockent des données uniquement sur SSDs?

0 votes

@A.L et bien non, je souligne simplement que l'offre SSD concerne le stockage de blocs, de fichiers, d'objets et de stockage éphémère.

26voto

shodanshok Points 42743

Essayons de répondre à une question à la fois :

  • Le support TRIM est-il nécessaire pour les SSD modernes (période 2015-2016) ?

Réponse courte : dans la plupart des cas, non. En revanche, pour garantir des performances cohérentes, même les disques grand public ont généralement de bonnes valeurs (mais il faut éviter les disques qui ont des difficultés avec les écritures soutenues). Les disques d'entreprise sont encore meilleurs, tant en raison de leur espace de réserve plus élevé par défaut que de l'optimisation de leur contrôleur/firmware pour une utilisation continue du disque. Par exemple, prenons le disque S3700 que vous avez mentionné : même sans trim, il a une très bonne cohérence d'écriture.

  • Les disques sont souvent annoncés comme ayant une meilleure collecte des déchets intégrée, cela dispense-t-il de l'utilisation de TRIM ? Comment fonctionne leur processus GC dans les environnements RAID ?

Le collecteur de déchets du disque fait son travail à l'intérieur du disque - il ne "voit" rien de l'environnement extérieur. Cela signifie qu'il est (pour la plupart) indépendant du niveau RAID de l'ensemble. Cela dit, certains niveaux RAID (essentiellement ceux basés sur la parité) peuvent parfois (dans certaines implémentations spécifiques) augmenter le facteur d'amplification d'écriture ; cela signifie donc plus de travail pour les routines GC.

  • De nombreux articles et discussions des années précédentes concernent la flash SLC par rapport à la flash MLC et le fait que la SLC est préférable en raison de sa durée de vie beaucoup plus longue, cependant, il semble que tous les SSD (indépendamment de leur position sur le spectre de consommation à entreprise) soient MLC de nos jours - cette distinction est-elle encore pertinente ?

Les disques SLC ont pratiquement disparu du secteur de l'entreprise, étant principalement utilisés pour des applications militaires et industrielles. Le marché de l'entreprise est aujourd'hui divisé en trois catégories :

  • La flash HMLC/MLCe est celle avec les puces MLC les mieux triées, certifiées pour supporter au moins 25 000/30 000 cycles de réécriture ;
  • Les puces 3D MLC sont évaluées à environ 5 000 à 10 000 cycles de réécriture ;
  • Les puces MLC planaires normales et 3D TLC sont évaluées à environ 3 000 cycles de réécriture.

En réalité, n'importe quel type de flash ci-dessus devrait vous offrir une capacité d'écriture totale suffisante. Vous pouvez d'ailleurs trouver des disques d'entreprise avec tous ces types de flash.

La vraie différence entre les disques d'entreprise et grand public réside dans :

  • le combo contrôleur/firmware, avec les disques d'entreprise beaucoup moins susceptibles de tomber en panne en raison de bugs de contrôleur inattendus ;
  • le cache d'écriture protégé par l'alimentation, extrêmement important pour éviter les corruptions de la couche de traduction flash (FTL), qui est stockée sur la flash elle-même.

Les disques d'entreprise sont meilleurs principalement en raison de leurs contrôleurs et de leurs condensateurs d'alimentation, plutôt que d'une meilleure flash.

  • Les SSD d'entreprise ont tendance à avoir une endurance/limite d'écriture beaucoup plus élevée (souvent mesurée en termes de combien de fois vous pouvez complètement réécrire le disque en une journée, tout au long de sa durée de vie attendue de 5 ans), cela dispense-t-il de tout souci quant à l'amplification des écritures due à l'absence de TRIM ?

Comme mentionné précédemment, les disques d'entreprise disposent par défaut d'un espace de réserve beaucoup plus élevé (~20 %), ce qui réduit considérablement la nécessité de TRIM réguliers.

Quoi qu'il en soit, veuillez prendre en compte que certains RAID logiciels prennent en charge les TRIM (quelqu'un a mentionné Linux MDRAID ?)

0 votes

Seulement 35000 cycles d'écriture?! Cela ne semble pas être beaucoup. Je suppose que cela a du sens si les remplacements de disque augmentent et sont moins chers que d'acheter la même capacité en SLC.

1 votes

~ Environ 30000 cycles de réécriture minimum garantis ne sont pas mauvais: avec la capacité accrue apportée par le passage au NAND 2 bits par cellule, les lecteurs MLC sont beaucoup moins chers que les SLC tout en maintenant une note de durabilité similaire. De plus, les jours où les cellules SLC de classe 50 nm étaient évaluées à >100000 cycles de réécriture sont probablement révolus: même les lecteurs professionnels ont du flash de classe 34/25 nm (ou plus petit), avec une durabilité intrinsèquement plus faible (ce qui affecte également les lecteurs SLC). ~

0 votes

@shodanshok Votre conclusion est "Utilisez des SSD de qualité professionnelle (SAS) attachés à un contrôleur RAID normal et ne vous inquiétez pas" - et je ne verrai pas de baisse de performances pendant les 5 ans de garantie d'un disque ? Et que les problèmes de performances documentés par d'autres utilisateurs n'affectent que les disques grand public ?

9voto

ewwhite Points 193555

TRIM n'est pas quelque chose dont je m'inquiète jamais lorsque j'utilise des SSD sur des contrôleurs RAID modernes. Les SSD se sont améliorés, les fonctionnalités des contrôleurs RAID matériels ont été optimisées pour ces charges de travail, et les rapports de durabilité sont généralement en place.

TRIM est destiné aux lecteurs SATA de gamme inférieure. Pour les SSD SAS, nous avons SCSI unmap, et c'est peut-être la raison pour laquelle je n'ai pas besoin de TRIM...

Mais l'autre commentateur a raison. Le stockage défini par logiciel (SDS) change la façon dont nous utilisons les SSD. Dans les solutions SDS, les contrôleurs RAID sont sans importance. Et des choses comme TRIM ont tendance à être moins importantes car les SSD remplissent des rôles spécifiés. Je pense au cache de lecture de stockage Nimble ou au ZFS L2ARC et ZIL... Ils répondent tous à des besoins spécifiques et le logiciel exploite les ressources de manière plus intelligente.

3 votes

UNMAP et TRIM font exactement la même chose.

2 votes

Trim/unmap est toujours nécessaire- sans cela, vous devriez complètement vous fier à la collecte des ordures internes

3 votes

La collecte interne des ordures n'est pas un substitut à TRIM. Il n'existe aucune fonctionnalité firmware pouvant remplacer ce que fait TRIM. Il est un peu alarmant que tant de réponses ici ne comprennent pas réellement ce que fait TRIM et pourquoi il est nécessaire. Se référer à des articles tels que celui-ci arstechnica.com/gadgets/2015/04/…

1voto

Raqib Points 101

Niveaux RAID avec SSD Une réponse ci-dessus suggère que les niveaux RAID avec parité, comme le RAID 5, augmentent l'amplification d'écriture. Il y a vraiment plus d'une façon d'interpréter cela : l'impact sur un lecteur ou l'impact sur l'ensemble des lecteurs.

Par rapport à l'absence de redondance, le RAID 5 ajoute des écritures à l'ensemble car il ajoute une parité de contrôle. Comparé à un groupe RAID 0 de (n-1) lecteurs, l'impact par lecteur d'un groupe RAID 5 avec n lecteurs est nul. Chacun des n lecteurs reçoit autant d'écritures. Le RAID 5 ajoute 1/(n-1) écritures supplémentaires à l'ensemble. En revanche, les RAID 1 et RAID 10 ajoutent 100% d'écritures supplémentaires à l'ensemble, car tout ce qui est écrit sur un SSD est écrit sur son miroir.

Ainsi, en termes d'écriture sur un ensemble RAID 5 par rapport à un ensemble RAID 10 avec le même nombre de lecteurs, les SSD de l'ensemble RAID 5 recevront moins d'écritures. Et cela reste vrai même si vous augmentez le nombre de SSD dans l'ensemble RAID 10 pour égaliser la capacité utilisable.

0voto

Raqib Points 101

Shodanshok a touché à la vraie réponse ici. Si vous réservez de l'espace supplémentaire, "surprovisionnez", l'endurance de votre SSD et la constance des performances d'écriture seront toutes deux améliorées au fil du temps, et le manque de support TRIM devient principalement sans importance. Réserver cet espace supplémentaire peut se faire aussi simplement qu'en commençant avec un nouveau SSD, en partitionnant moins que la pleine capacité. La plupart des contrôleurs intégrés traitent l'espace jamais utilisé de la même manière que l'espace réservé et réduisent ainsi considérablement l'amplification d'écriture. Pour le démarrage et le système d'exploitation, un espace réservé de 10% est probablement suffisant. Pour les disques qui sont souvent réécrits, augmentez cet espace.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X