114 votes

Pourquoi le stockage d'entreprise est-il si cher ?

Il s'agit d'un Question canonique sur le coût du stockage en entreprise.
Voir aussi la question suivante :

En ce qui concerne les questions générales comme :

  • Pourquoi dois-je payer 50 dollars par mois pour un gigaoctet supplémentaire de stockage ?
  • Notre serveur de fichiers est toujours à court d'espace, pourquoi notre administrateur système n'ajoute-t-il pas un disque supplémentaire de 1 To ?
  • Pourquoi les équipements SAN sont-ils si chers ?

Les réponses fournies ici tenteront d'apporter une meilleure compréhension du fonctionnement du stockage au niveau de l'entreprise et de ce qui influence le prix. Si vous pouvez développer la question ou donner un aperçu de la réponse, merci de le faire.

120voto

Shlomi Fish Points 1951
  1. Les capacités des disques durs des serveurs sont minuscules par rapport à celles des disques durs des ordinateurs de bureau. Il n'est pas rare de voir des disques de 450 et 600 Go dans des serveurs neufs, et vous pouvez acheter plusieurs disques SATA de 4 To pour le prix d'un disque dur de bureau. un Disque dur SAS (serveur) de 600 Go.

  2. Le disque dur SATA de votre PC de bureau à la maison est comme une voiture musclée de Ford, GM, Mercedes ou tout autre fabricant de voitures pour tous les jours (grande capacité V8 ou V12, 5 ou 6 litres). Parce qu'elles doivent être conduites par des personnes qui n'ont pas de licence de course, ou qui ne comprennent pas comment fonctionne un moteur à combustion interne, elles ont des tolérances très importantes. Ils ont des limiteurs de régime, ils sont conçus pour fonctionner avec n'importe quelle huile d'une certaine qualité, ils ont des intervalles d'entretien de 10 000 km, mais si vous manquez un intervalle d'entretien de quelques semaines, il ne vous explosera pas au visage. Ils ne prennent pas feu lorsque vous parcourez de longues distances.

    Le lecteur SAS d'un serveur s'apparente davantage à un moteur de formule 1. Ils sont vraiment petits (2,4 litres) mais ont une puissance immense en raison de leurs tolérances minuscules. Ils tournent à des régimes élevés et n'ont souvent pas de limiteur de régime (ce qui signifie qu'ils subissent de graves dommages en cas de conduite incorrecte). heures ) ils explosent.

    Tu es en train de comparer de la craie et du fromage. Les chiffres et une analyse complète sont présentés dans le livre blanc d'Intel. Disques durs de classe entreprise ou de classe ordinateur

  3. Parlons de chiffres précis. Disons que vous demandez 1 Mo de données supplémentaires (un joli chiffre rond). Combien de données cela représente-t-il ? realmente ? Eh bien, votre 1MB de données va aller dans une matrice RAID. Disons qu'ils sont prudents et qu'ils le font en RAID1. Votre 1MB de données est mis en miroir, donc c'est en fait 2MB de données.

    Disons que vos données se trouvent dans un SAN. En cas de défaillance d'un nœud SAN, vos données sont synchronisées au niveau de l'octet sur un deuxième nœud SAN. Elles sont donc dupliquées, et vos 2 Mo de données sont maintenant 4 Mo.

    Vous attendez de votre fournisseur qu'il conserve des sauvegardes sur site, afin que vos données puissent être restaurées en cas d'urgence non catastrophique ? Tout bon fournisseur vous fournira au moins une sauvegarde sur site, voire plus. Disons qu'il prend des clichés une fois par semaine pendant trois semaines sur site. Cela représente 3 Mo de données supplémentaires, ce qui porte votre capacité à 7 Mo.

    En cas de sinistre grave, votre fournisseur a intérêt à avoir une copie conservée hors site quelque part. Même si elle date d'un mois, elle doit exister. Donc maintenant, vous en êtes à 8MB.

    S'il s'agit d'un fournisseur de très haut niveau, il peut même avoir un site de reprise après sinistre qui est synchronisé en direct. Ces disques seront également RAIDés, ce qui représente 2 Mo supplémentaires et vous permet d'atteindre 10 Mo de données.

    Vous allez devoir transférer ces données un jour ou l'autre. Quoi ? Les transférer ? Oui, le transfert de données coûte de l'argent. Cela coûte de l'argent lorsque vous les téléchargez, lorsque vous y accédez par Internet, cela coûte même de l'argent pour les sauvegarder (quelqu'un doit sortir ces bandes du bureau, et il se peut que votre 1 Mo de données l'oblige à acheter un jeu supplémentaire de bandes et à les transférer quelque part).

  4. Lorsque votre disque dur SATA tombe en panne, vous devez appeler le support technique et les convaincre que votre disque est mort. Puis envoyez votre disque au fabricant (à vos frais la plupart du temps). Attendez une semaine. Vous recevez un disque de remplacement et vous devez le réinstaller (il est presque certain qu'il n'est pas échangeable à chaud ou qu'il n'est pas déjà dans un support de disque).

    Quand ce disque SAS tombe en panne, vous appelez le support technique. Ils ne remettent presque jamais en question votre opinion selon laquelle le disque doit être remplacé immédiatement et expédient un nouveau disque ; en général, le nouveau disque est livré le jour même, mais le lendemain est également très fréquent. Le fabricant envoie souvent un représentant pour installer le disque si vous ne savez pas comment faire (très pratique si vous prévoyez de partir en vacances et que vous avez besoin que les choses continuent de fonctionner pendant votre absence).

  5. Les disques d'entreprise ont des tolérances serrées, voir le point 2 ci-dessus, et ont tendance à durer environ 10 fois plus longtemps que les disques de qualité grand public (MTBF). Les disques d'entreprise prennent presque toujours en charge la détection avancée des erreurs et des pannes, ce qui, selon un rapport de Google, ne fonctionne que dans 40 % des cas, mais c'est quelque chose que tout le monde préfère à un ordinateur qui meurt soudainement.

    Lorsque vous avez un seul disque dans votre ordinateur personnel, ses chances statistiques de défaillance sont simplement celles du disque. Autrefois, les disques étaient évalués en termes de MTBF (les disques SAS bénéficiant toujours d'une évaluation supérieure d'environ 50 %, voire plus), aujourd'hui, il est plus courant de voir les taux d'erreur. Un disque SAS typique est 10 à 1 000 fois moins susceptible d'avoir une erreur irrécupérable (100x étant le plus courant, comme je l'ai constaté récemment). (taux d'erreur selon la documentation du fabricant fournie par Seagate, Western Digital et Hitachi ; aucun parti pris intentionnel ; rejet exprès de toute indemnisation).

    Les taux d'erreur sont particulièrement importants non pas lorsque vous rencontrez une erreur irrécupérable sur un disque, mais lorsqu'un autre disque de la même matrice tombe en panne et que vous ne comptez pas sur le fait que tous les disques d'une matrice soient lisibles pour récupérer le disque défaillant.

  6. SAS est un dérivé de SCSI, qui est un protocole de stockage. SATA est basé sur ATA, qui est lui-même basé sur le bus ISA (le bus 8/16 bits des ordinateurs de l'ère des dinosaures). Le protocole de stockage SCSI comporte des commandes plus étendues pour optimiser la manière dont les données sont transférées des lecteurs aux contrôleurs et inversement. Cette amélioration de l'efficacité rendrait un disque SAS, par ailleurs égal, intrinsèquement plus rapide qu'un disque SATA, notamment en cas de charges de travail extrêmes ; elle en augmente également le coût.

  7. Il y a moins de disques SAS produits, les économies d'échelle font qu'ils seront plus chers, toutes choses égales par ailleurs.

  8. Les disques SAS sont généralement proposés à des vitesses de rotation de 10 ou 15 k, tandis que les disques SATA sont généralement proposés à des vitesses de 5,4 ou 7,2k. Les disques SAS, en particulier les disques de 2,5 pouces qui deviennent de plus en plus populaires, ont des temps de recherche plus rapides. La combinaison de ces deux éléments augmente considérablement le nombre d'opérations d'entrée/sortie qu'un disque peut effectuer, un disque SAS étant généralement 3 fois plus rapide. Lorsque plusieurs utilisateurs demandent des données disparates, la capacité d'IOps du disque/de la matrice devient un indicateur de performance critique.

  9. Les disques d'un centre de données sont généralement sous tension en permanence. Des études ont montré que la défaillance d'un disque est influencée par le nombre de cycles de chauffage/refroidissement qu'il subit (entre le fonctionnement et l'arrêt). Le fait de les laisser sous tension en permanence augmente généralement la durée de vie du disque. La conséquence est que les disques consomment de l'électricité. Cette électricité doit être fournie par quelque chose (dans le cas d'un grand DC, les disques à eux seuls peuvent consommer plus d'énergie qu'un petit quartier de maisons). Ils doivent également dissiper cette chaleur quelque part, ce qui nécessite des systèmes de refroidissement (qui consomment eux-mêmes plus d'énergie pour fonctionner).

  10. Coûts d'infrastructure et de personnel. Ces disques sont dans des unités NAS ou SAN haut de gamme. Ces unités sont coûteuses, même sans les disques coûteux qu'elles contiennent. Elles nécessitent un personnel coûteux pour les déployer et les entretenir. Les bâtiments dans lesquels se trouvent ces unités NAS et SAN sont coûteux à exploiter (voir le point sur le refroidissement, ci-dessus, mais il y a beaucoup plus que cela). Le logiciel de sauvegarde n'est généralement pas gratuit (pas plus que les licences pour des choses comme la mise en miroir), et le personnel pour déployer et maintenir les sauvegardes est généralement coûteux aussi. Le coût de la location d'un système de livraison et de stockage de bandes hors site n'est qu'une des nombreuses choses qui commencent à s'accumuler lorsque vous avez besoin de plus de stockage.

Si l'on garde à l'esprit que la capacité de leurs disques peut très bien être 1/10ème de la taille d'un disque de bureau, et cinq fois plus chère, que votre 1MB de données est en fait 10, et toutes les autres différences, il est impossible de tirer des conclusions significatives entre le prix de votre stockage de bureau et le prix du stockage de niveau entreprise.

33voto

Colin Pickard Points 1241

Je n'ajoute pas cette réponse au top CW, principalement parce qu'il s'agit d'une différence d'opinion. N'hésitez pas à fusionner/éditer cette réponse si vous le souhaitez.

Souvent, la raison pour laquelle le stockage "de niveau entreprise" est si cher pourrait être que le demandeur ne comprend pas l'exigence, mais parfois aussi que l'administrateur système ne comprend pas l'exigence, ne peut pas communiquer l'exigence à une personne ayant le pouvoir d'achat, ou est simplement ignoré par ladite autorité.

Les baies de stockage standard à haute performance, à haute disponibilité et à faible maintenance sont les suivantes coûteux . Une partie du travail d'un concepteur de systèmes consiste à savoir où ceux-ci sont appropriés, et où une conception différente est appropriée.

Je ne pense pas que les coûts relatifs des différents types de disques durs soient réellement pertinents pour l'une ou l'autre des questions de l'exemple.

Pourquoi dois-je payer 50 dollars par mois ? par gigaoctet supplémentaire de stockage ?

Cette question s'adresse clairement à un fournisseur de services. À mon avis, les deux réponses possibles sont :

  1. Vous bénéficiez d'un temps de fonctionnement de 5 neuf, d'une assistance 24/7, à Manhattan/Londres/Hong Kong. Les plateaux tournants ne sont qu'une petite partie de la pile que vous payez.

  2. Vous payez trop cher. Négociez, changez de fournisseur ou faites appel à vos services.

Notre serveur de fichiers est toujours à court d'espace, pourquoi notre administrateur système n'ajoute-t-il pas un disque supplémentaire de 1 To ?

Il s'agit presque certainement d'une mauvaise conception (et probablement pour des raisons politiques). Les données sur ce serveur de fichiers se situent quelque part dans ce spectre :

  • Les données valent la peine d'être stockées dans une configuration à haute performance, à haute disponibilité et à coût élevé. Les temps d'arrêt causés par le manque d'espace affectent votre haute disponibilité et constituent un échec de conception ou de planification.

  • Les données ne sont pas importantes ou des performances lentes ou des temps d'arrêt plus longs sont acceptables. Les disques bon marché et les solutions de sauvegarde bon marché sont acceptables. Des temps d'arrêt réguliers dus à un manque d'espace disque semblent toujours être un compromis étrange, puisque la majorité de votre coût dans ce cas sera probablement le temps de votre administrateur système, et à long terme, il passera plus de temps à dépanner un espace disque faible.

Notez que j'ai dit qu'il s'agissait d'un spectre, et que la plupart des exigences se situent quelque part entre les deux.

6voto

Zweiclops1206 Points 141

Je suis d'accord avec les autres messages concernant la qualité de ce que propose une société d'hébergement. Mais nous avons récemment renouvelé notre contrat d'hébergement et fait le tour des fournisseurs. Personne n'était compétitif en termes d'espace de stockage, et les prix n'étaient pas inférieurs à ceux de notre contrat précédent, vieux de trois ans. Le prix des disques SAS a baissé, celui des étagères/rays de disques/SAN/FC/switches a baissé, tout a baissé. Mais pas le stockage sur disque ?

Un collègue avec beaucoup plus d'expérience m'a fait remarquer la tactique. Le prix du CPU, de la mémoire, de la bande passante était éblouissant ! Inscrivez-vous ici ! Inscrivez-vous maintenant et ignorez ce problème d'espace disque ! Vous n'aurez pas besoin d'autant d'espace disque. Regardez l'unité centrale et la mémoire !

Une fois que vous vous êtes commit dans leur contrat, ils vous ont vraiment eu, et ils font leurs revenus sur l'espace disque. Oui c'est RAID-5 et haute performance etc mais les sauvegardes coûtent plus cher, la réplication hors site coûte plus cher.

Pour les sociétés d'hébergement, il s'agit d'un modèle économique. La plupart des entreprises font quelque chose de similaire avec leurs prix : elles réduisent tel prix ici mais augmentent tel autre là-bas pour compenser leurs revenus ailleurs. Elles doivent aussi payer leur loyer et leurs salaires.

Pour les serveurs internes, les problèmes sont différents. Vous ne pouvez pas simplement entrer dans une salle de serveurs avec la boîte Fedex qui contient votre nouveau disque dur de 3 To. Si vous avez prévu une extension, c'est plus facile, mais les serveurs/racks/rays peuvent déjà avoir atteint leur capacité en termes d'emplacements, d'E/S, de cartes de contrôleur et d'alimentation.

C'est comme regarder sous un rocher, vous serez surpris de ce que vous pourrez trouver.

6voto

Rob Moir Points 31534

Il est également important de noter que le stockage "local" pourrait bien coûter plus cher que vous ne le pensez.

Dans le cadre d'un exercice visant à déplacer certaines de nos données "archivées" vers le nuage, j'ai récemment effectué un exercice de tarification comparant le coût de l'espace disque disponible (c'est-à-dire formaté plutôt que brut) sur notre SAN le plus récent au coût du stockage dans le service de données en nuage Amazon.

Si l'on considère le prix payé pour le SAN lui-même, y compris les disques, en supposant une durée de vie de 5 ans pour le matériel du SAN, et pas En tenant compte des frais généraux liés à l'exploitation de notre salle de serveurs, notre prix pour 150 Go de stockage local est de 31,88 $ par mois, contre 28,41 $ pour Amazon (en supposant un taux de trafic mensuel de 20 % en hausse et en baisse).

Je ne vais pas me précipiter pour transférer tout notre stockage dans le nuage, car le stockage local présente d'autres avantages, mais je pense que ce genre d'exercice de tarification est utile : Si vous pensez que le stockage en nuage est cher, alors combien coûtez-vous ? realmente payer pour votre stockage local ?

6voto

MagicAndi Points 10128

Le coût de production d'un article est directement lié au volume d'unités qu'il vendra dans une boucle de rétroaction.

Dans le cas d'un disque dur conventionnel, avec du verre rouillé et de l'électronique en rotation, il y a potentiellement une énorme variation dans le coût des composants mécaniques et électroniques - cependant, 2 bandes claires de prix/qualité ont émergé - Entreprise et Commodité.

Cependant, le volume réduit des ventes d'un disque d'entreprise a un impact important sur le rapport qualité-prix : un produit sept fois plus cher ne sera pas sept fois meilleur.

Les unités d'entreprise (pour une capacité donnée) sont légèrement plus rapides que les unités de base, par exemple en comparant les disques Seagate Barracuda SATA (base) et Cheetah SAS (entreprise) :

model            Barracuda            Cheetah
capacity(Gb)     500                  450
sustained data   125                  168
   rate (Mb/s)
cache(Mb)        16                   64
annual failure   <1%                  0.44%
   rate
Price GBP        42                   275
Price USD        67                   440

Mais dans un contexte d'entreprise, aucun administrateur système sain d'esprit ne stockerait jamais des données importantes sur un seul disque. L'utilisation de plusieurs disques offre une plus grande fiabilité et une meilleure bande passante, et réduit efficacement la latence ; quatre disques Barracuda configurés en RAID10 seront beaucoup plus rapides qu'un seul disque Cheetah, avec beaucoup moins de risques de perte de données, pour environ 60 % du prix.

Vous bénéficierez certainement d'une meilleure garantie avec le disque d'entreprise, et le fournisseur sera généralement en mesure de vous en livrer un le jour même - mais vous serez probablement en mesure de vous procurer un disque de base auprès d'un fournisseur local plus rapidement que votre fournisseur ne pourra vous envoyer le disque de remplacement par courrier. D'un autre côté, le disque d'entreprise a plus de chances d'être un remplacement exact du disque défaillant.

Alors peut-être que les disques d'entreprise sont beaucoup plus fiables ? Bien que les fabricants et les vendeurs de disques affirment souvent que c'est le cas (Seagate est plutôt timide à ce sujet sur son site Web - mais même les chiffres obscurs qu'ils publient montrent que c'est moins d'un facteur 2). Des études indépendantes suggèrent qu'il y a aucune différence significative .

Le jeu de commandes SCSI présente certains avantages techniques par rapport au jeu de commandes ATA, notamment en ce qui concerne la possibilité pour le système d'exploitation de savoir exactement ce qui est engagé sur le disque. Toutefois, là encore, cela ne fait une réelle différence que si l'on considère les performances et la fiabilité d'un système de fichiers mis en œuvre sur un seul disque.

Si votre fournisseur de services exploite un réseau SAN Fibre Channel, le coût par gigaoctet de stockage sera au moins huit fois supérieur à celui d'un disque acheté dans le magasin de bricolage le plus proche. Mais il existe autres approches ce qui peut faire baisser le coût de manière significative.

Notez que cela ne sera jamais moins cher que l'achat d'un disque standard, car vous devez également payer pour la redondance, l'alimentation, la climatisation et le support, mais ces coûts devraient être faibles par rapport au coût de la fourniture de stockage.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X