319 votes

100% de temps de fonctionnement pour une application web

Nous avons reçu aujourd'hui une "exigence" intéressante de la part d'un client.

Ils veulent un temps de fonctionnement de 100% avec hors site basculement sur une application web. Du point de vue de notre application web, ce n'est pas un problème. Elle a été conçue pour être capable de s'étendre sur plusieurs serveurs de base de données, etc.

Cependant, pour des raisons de réseau, je ne parviens pas à trouver comment le faire fonctionner.

En bref, l'application sera hébergée sur des serveurs au sein du réseau du client. Elle est accessible à la fois par des personnes internes et externes. Le client souhaite que nous conservions une copie hors site du système qui, en cas de panne grave dans ses locaux, serait immédiatement prise en charge.

Nous savons maintenant qu'il n'y a absolument aucun moyen de résoudre ce problème pour les personnes internes (pigeon voyageur ?), mais ils veulent que les utilisateurs externes ne le remarquent même pas.

Très franchement, je n'ai pas la moindre idée de comment cela pourrait être possible. Il semble que s'ils perdent la connectivité Internet, nous devrions modifier les DNS pour transférer le trafic vers les machines externes... Ce qui, bien sûr, prend du temps.

Des idées ?

UPDATE

J'ai eu une discussion avec le client aujourd'hui et ils ont clarifié la question.

Ils ont maintenu le chiffre de 100 %, affirmant que l'application devrait rester active même en cas d'inondation. Cependant, cette exigence ne s'applique que si nous l'hébergeons pour eux. Ils ont dit qu'ils s'occuperaient de l'exigence de temps de fonctionnement si l'application vivait entièrement sur leurs serveurs. Vous pouvez deviner ma réponse.

50 votes

Ne sous-estimez pas l'énorme temps d'indisponibilité causé par le piratage, regardez Sony et le réseau PlayStation. Vous pouvez être sûr qu'ils avaient la même idée d'un temps de fonctionnement de 100 % et l'argent/le matériel pour le soutenir. Expliquez clairement au client qu'un temps de fonctionnement de 100 % est une attente irréalisable, même les techniciens de Google hésiteraient à marmonner "100 % de temps de fonctionnement".

185 votes

Je voudrais personnellement RUN de ce client aussi vite que possible. Je pense que ce ne sera pas la dernière idée folle qu'ils auront (d'un point de vue technologique).

140 votes

J'aimerais pouvoir rétrograder votre client.

10voto

Irving Points 146

Il y a deux types de personnes qui demandent un temps de fonctionnement de 100% :

  1. Les personnes n'ayant absolument aucune connaissance des ordinateurs, des systèmes informatiques ou de l'Internet.
  2. Ceux qui se ridiculisent intentionnellement, soit pour tester votre capacité à dire non (Google "le test du jus d'orange"), soit pour essayer d'obtenir une sorte de contrat SLA afin de ne pas avoir à vous payer plus tard.

Mon conseil, ayant subi ces deux types de clients à de nombreuses reprises, est de ne pas prendre ce client. Laissez-les rendre quelqu'un d'autre fou.

*Cette même personne n'aurait aucune gêne à s'informer sur les voyages plus rapides que la lumière, le mouvement perpétuel, la fusion froide, etc.

2 votes

+1 pour le test du jus d'orange J'aime bien et je ne connaissais pas :)

8voto

scope_creep Points 1841

Je communiquerais avec le client pour établir avec lui ce que signifie exactement un temps de disponibilité de 100 %. Il est possible qu'il ne fasse pas vraiment la différence entre 99 % et 100 % de disponibilité. Pour la plupart des gens (c'est-à-dire pas les administrateurs de serveurs), ces deux chiffres sont les mêmes.

6voto

fields Points 670

C'est facile. L'accord de niveau de service d'Amazon EC2 stipule clairement :

Le "pourcentage de temps de fonctionnement annuel" est calculé en soustrayant de 100% le pourcentage de périodes de 5 minutes au cours de l'Année de Service durant lesquelles Amazon EC2 était dans l'état de "Région non disponible".

http://aws.amazon.com/ec2-sla/

Définissez simplement le "temps de fonctionnement" comme étant relatif à l'ensemble des services que vous pouvez maintenir opérationnels 100 % du temps, et vous ne devriez avoir aucun problème.

Il convient également de souligner que le but d'un accord de niveau de service est de définir vos obligations et ce qui se passe si vous ne pouvez pas les respecter. Peu importe que le client demande 3 neuf, 5 neuf ou un million de neuf, la question est de savoir ce qu'il obtiendra si vous ne pouvez pas les respecter. La réponse évidente est de prévoir une ligne pour un temps de fonctionnement de 100 % à 5 fois le prix que vous voulez facturer, et de prévoir un remboursement de 4 fois si vous n'atteignez pas cet objectif. Vous pourriez marquer des points !

6voto

axis Points 219

100% de temps de fonctionnement ?

Voici ce dont vous avez besoin :

Plusieurs serveurs DNS (et redondants), pointant vers plusieurs sites dans le monde entier, avec des accords de niveau de service appropriés avec chaque fournisseur d'accès.

Assurez-vous que les serveurs DNS sont configurés correctement, avec des TTL reconnus efficacement.

1 votes

Oui, le DNS est un bon début. nslookup google.com renvoie 6 IP différentes pour la redondance au cas où certaines d'entre elles ne fonctionneraient pas. Consultez également RobTex.com, un excellent site pour examiner les configurations de certains domaines, par exemple robtex.com/dns/google.com.html#records

5voto

Paul Points 1228

Les changements DNS ne prennent du temps que s'ils sont configurés pour prendre du temps. Vous pouvez fixer le TTL d'un enregistrement à une seconde - votre seul problème serait de vous assurer que vous fournissez une réponse rapide aux requêtes DNS et que les serveurs DNS peuvent faire face à ce niveau de requêtes.

C'est exactement comme cela que GTM fonctionne dans F5 Big IP - le DNS TTL par défaut est défini à 30 secondes et si un membre du cluster doit prendre le relais, le DNS est mis à jour et la nouvelle IP est prise presque immédiatement. La durée maximale de la panne est de 30 secondes, mais il s'agit d'un cas limite, la moyenne étant de 15 secondes.

10 votes

D'après mon expérience, certains serveurs DNS ne tiennent pas compte d'un TTL qu'ils considèrent comme excessivement bas (en dépit de la RFC). Tout ce qui est inférieur à 5 minutes devient peu fiable à l'échelle mondiale.

2 votes

Ils ne gèrent pas de DNS s'ils ne respectent pas le TTL et peuvent donc être ignorés - ils ont pris leur propre décision de "casser l'internet" pour leurs utilisateurs. De nombreuses solutions de basculement reposent sur le respect du TTL.

13 votes

@Paul ignorer la réalité n'est pas une pratique acceptable, même si cela énerve tout le monde.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X