2 votes

Performance en fonction de la taille d'un disque dans un RAID 5

Alors je suis coincé dans un coin, j'ai un projet de stockage limité à 24 broches, et nécessite des écritures aléatoires intenses (le côté lecture correspondant est purement séquentiel). J'ai besoin de chaque bit d'espace sur mes disques, environ 13 To au total dans un raid-5 en n-1, et ça doit aller vite, à plus de 2 Go/s, vraiment rapide.

La réponse évidente serait d'utiliser un Stripe/Concat (Raid-0/1), ou mieux encore un raid-10 à la place du raid-5, mais cela est interdit pour des raisons indépendantes de ma volonté. Je demande donc de l'aide ici pour obtenir une configuration sous-optimale aussi bonne que possible.

Le réseau est construit sur des disques SAS-2 attachés directement à 10 000 tr/min, gérés par un contrôleur série ARECA 18xx avec 4 Go de mémoire cache. Bandes de 64 Ko dans le réseau et un système de fichiers XFS aligné sur des bandes de 4 Ko, avec 24 groupes d'allocation (pour éviter une partie de la pénalité dû au raid 5).

Le cœur de ma question est le suivant : Avec la même configuration avec 6 broches/AG, je vois une performance presque limitée par le disque en écriture, environ 100 Mo/s par broche, à 12 broches je vois cette valeur chuter à environ 80 Mo/s et à 24 environ 60 Mo/s.

Je m'attends à ce que avec une parité distribuée et des AG assortis, les performances devraient être proportionnelles au nombre de broches, ou être pires avec un petit nombre de broches, mais cet ensemble fait le contraire.

Qu'est-ce que je rate ?

Est-ce que les performances en Raid-5 augmentent avec le nombre de broches ?

Merci beaucoup pour vos réponses et idées, entrées ou conseils.

--Bill Edit: Améliorer les performances RAID L'autre fil pertinent que j'ai pu trouver, discute de certains des mêmes problèmes dans les réponses, bien qu'il ne me donne toujours pas de réponse sur l'évolution des performances.

6voto

Chopper3 Points 99341

ANY RAID 5 est sub-optimal, un tableau R5 de 24 disques est tout simplement stupide, je ne veux pas être impoli mais la plupart des contrôleurs de tableau matériel ne vous permettront pas de créer un tableau R5 de 24 disques, pensez à la quantité de données que vous pourriez perdre sans même le savoir. De plus, si vous effectuez n'importe quelle quantité d'écriture en RAID5 ou 6 n'est pas la voie à suivre, en fait, ajouter plus de broches risque simplement de ralentir les choses.

Que ce soit d'un point de vue performance ou fiabilité, VOUS DEVEZ convertir cela en RAID 10 dès que possible, c'est vraiment la seule voie à suivre, tout autre choix n'est rien de plus que de l'argent jeté par les fenêtres.

2voto

ewwhite Points 193555

Quels sont les différents niveaux RAID largement utilisés et quand devrais-je les considérer ?

RAID-5 à cette échelle pourrait poser problème (temps de reconstruction, risque accru de défaillance de l'ensemble). Votre vitesse d'écriture aléatoire ne sera pas du tout raisonnable (peut-être la bande passante d'un seul disque), et ne sera pas évolutif avec les broches.

1voto

Basil Points 8771

Votre limite ici est votre contrôleur de disque en bande. Les écritures aléatoires, comme un grand cache, et les RAID basés sur la parité, comme un calculateur de parité rapide. Plus vous ajoutez de disques à un ensemble RAID basé sur la parité (comme RAID 5 ou 6) sur un contrôleur attaché localement, moins vous verrez de performances par broche. Les grands stockages directement attachés (au-dessus de 8 disques ou plus) ont tendance à être en raid 10 pour éviter ce problème. La seule raison d'utiliser un RAID basé sur la parité (5 ou 6) est de bénéficier d'un rapport plus élevé d'espace utilisable. L'inconvénient est que si vous perdez un disque, la reconstruction prendra plus de temps si le RAID était important.

Pas de nouveau matériel

Si votre matériel est fixe et que vous devez faire fonctionner cela aussi bien que possible, alors vos meilleures performances viendraient du RAID 10, cependant vous perdriez la moitié de l'espace disponible. De plus, bien qu'il semble plus résilient au début car vous pouvez perdre jusqu'à la moitié des disques sans panne, vous pouvez toujours perdre des données si vous perdez les deux mauvais disques.

L'autre option pour le stockage attaché localement est ZFS. Je ne prétends pas connaître son fonctionnement interne, mais ce que je comprends, c'est qu'il ignorera complètement la carte RAID et travaillera sur les disques sous-jacents. Il pourrait avoir une pénalité plus faible sur la parité pour les petites écritures si vous le configurez correctement.

Nouveau matériel

Si vous avez de l'argent pour résoudre ce problème, vous seriez bien avisé d'investir dans un meilleur contrôleur de disque en bande. Quelque chose avec plus de cache et un processeur plus rapide. Si vous décidez d'utiliser un RAID basé sur la parité, vous seriez mieux servi en créant plusieurs RAIDs - de préférence 3 groupes avec 8 broches chacun.

Mieux encore que cela serait d'obtenir un stockage externe: quelque chose qui a un contrôleur de stockage qui gère tout le cache et le calcul de la parité, et permet simplement l'accès au stockage via SAS ou fibre optique.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X