6 votes

Structure de serveurs à tolérance de pannes pour les plus petites entreprises

J'essaie de savoir ce qu'il faut faire pour une petite entreprise qui a été assaillie par des problèmes matériels ridicules. Actuellement, cette entreprise fonctionne avec cinq ou six ordinateurs de bureau ; aucune infrastructure de serveur n'est en place. En plus de cela, et je n'enjolive pas les choses, elle a connu quatre pannes matérielles depuis le début de l'année, ce qui l'amène à frôler la folie.

J'ai déjà discuté avec eux de l'idée de mettre en place un Small Business Server (c'est un magasin Microsoft), et ils sont réceptifs à l'idée. Je prévois également de me familiariser avec System Center Essentials pour garder un œil sur les choses. Il s'agit ensuite de s'assurer que ce serveur reste disponible.

Aussi, je viens de lire cet autre fil de haute disponibilité. Comme le type dans ce fil de discussion, je suis très novice en matière d'informatique, je viens plutôt d'un milieu de programmation.

Quelques idées me viennent à l'esprit :

  • Raid-5 simple avec hot-swap éditer : et de hot-spare
  • Obtenir deux machines serveur moins chères, configurer pour faire fonctionner un serveur virtualisé avec migration à chaud (j'ai fait quelques lectures mais malheureusement je ne peux pas dire si SBS Standard et SCE supporteront cela).
  • La mise en grappe avec basculement ? Ce terme m'a été donné par l'autre fil de discussion, mais je n'y ai pas été exposé dans le passé.

Existe-t-il une meilleure pratique en la matière ? Le propriétaire de l'entreprise est prêt à mettre la main à la poche pour cela, car il est de plus en plus terrifié par les temps d'arrêt, mais je n'ai pas d'expérience dans ce domaine pour me diriger dans une direction plutôt que dans une autre.

J'apprécierais votre sagesse !

éditer : Pour fournir quelques détails supplémentaires sur les problèmes qu'ils ont rencontrés, il s'agit d'un mélange bizarre de défaillances inexplicables.

  • L'interrupteur du châssis ne parvient pas à mettre le système sous tension : la carte mère était équipée d'un interrupteur intégré, ce qui a fourni une solution provisoire, mais le remplacement du boîtier n'a pas résolu le problème. Plus tard, le remplacement de la carte mère n'a pas non plus résolu le problème.
  • Deux machines identiques ont subi des pannes de disque dans leurs matrices raid-1, et les deux machines ont été assemblées il n'y a pas plus de 5 mois.
  • Problèmes d'échec de démarrage : un système en raid-1 ne démarre pas du tout. Malheureusement, je n'ai pas noté le message d'erreur original, mais dans mes notes, j'ai noté que "Failed to save startup options" dans Windows Repair & Recovery m'a conduit à ce fil ce qui a confirmé mes soupçons sur le fait que c'était un problème lié au matériel.

éditer : De plus, les machines sont utilisées dans une série de bureaux à domicile, ce qui implique que l'électricité est de qualité résidentielle. Je suppose que cela peut être un facteur contributif plus important que je ne le pensais. Cependant, les machines fonctionnent toutes sur des bureaux (littéralement des bureaux !) et non sur le sol ; je ne pense pas que la poussière soit en cause.

5voto

GregD Points 8703

Tout d'abord, SCE est une surcharge pour 5-6 machines de bureau. WSUS est probablement une meilleure option et est gratuit.

Vous n'avez pas dit grand-chose sur ce qui a échoué exactement. S'agit-il d'une pièce de la machine ? S'agit-il d'un environnement poussiéreux ? Mon environnement de support principal compte environ 40 utilisateurs avec environ 10 serveurs (sans compter les serveurs virtualisés). Nous achetons des machines Dell (Optiplex) et nous avons eu peut-être 4 défaillances matérielles au cours des 5 dernières années sur TOUT ce matériel. Donc ce que vous voyez sur les stations de travail, n'est pas normal.

Disposent-ils d'une salle ou d'un emplacement approprié pour le serveur (avec un système de refroidissement et peu de poussière, au moins ?)

Raid-5 avec échange à chaud est une solution peu coûteuse pour ce serveur et offre une certaine protection contre les pannes de disque dur. J'ajouterais également des alimentations redondantes (peu coûteuses) et un onduleur.

  • Matériel de classe serveur
  • Raid sur les disques durs (édité pour ajouter)Avoir un disque de secours disponible est probablement exagéré, puisque la plupart des disques sous garantie peuvent être envoyés par voie postale. Avec 3 disques dans un raid-5 par exemple, vous pouvez perdre un disque et être tranquille jusqu'à ce que le nouveau disque arrive. Par contre, si vous perdez >1 disque, vous êtes foutu, peu importe comment vous le voyez.
  • alimentations redondantes
  • Garantie appropriée (avec Dell par exemple, nous obtenons le jour ouvrable suivant et gardons votre disque dur parce que nous pouvons vivre avec un jour de panne sur n'importe lequel de nos serveurs).
  • Solution de sauvegarde

La mise en grappe avec basculement ? Vous commencez à entrer dans un domaine qui est à la fois coûteux et complexe pour un si petit environnement. N'oubliez pas que dans un si petit environnement, si le temps de fonctionnement est important, il est également important de se rappeler que vous souhaitez garder les choses aussi simples que possible .

Pour ce qui est des postes de travail, il faut s'attaquer au problème (sur lequel vous n'avez pas été très clair). Peut-être pourriez-vous acheter un poste de travail "supplémentaire" sur lequel se trouve votre image de base, qui reste là et prend toutes vos mises à jour depuis WSUS, et que vous pourriez utiliser comme machine de remplacement si l'un de leurs postes de travail tombe en panne (ce que nous faisons). Nous disposons également d'un grand nombre de pièces que nous pouvons échanger pour remplacer les pièces les plus courantes qui tombent en panne (alimentations, RAM, disques durs) jusqu'à ce que la pièce sous garantie arrive.

Sauvegardes. Aucune redondance ne peut remplacer de bonnes sauvegardes. Vous avez ici de nombreuses possibilités. Avec un environnement aussi petit, vous pouvez envisager de nombreuses solutions "over-the-wire" (Mozy, Carbonite, par exemple) qui prennent en charge les sauvegardes hors site et automatisées à un coût raisonnable. Vous pouvez également opter pour une solution à bandes et faire appel à un service comme Iron Mountain pour mettre les bandes en voûte hors site. Quoi que vous fassiez, n'emportez pas de cassettes chez vous ! surtout s'ils contiennent des informations importantes (numéro de sécurité sociale, etc.).

2voto

Snaky Love Points 111

D'après mon expérience, SBS a son propre lot de problèmes. Surtout si vous le configurez en cluster, etc. L'effort de maintenance est beaucoup trop important pour une si petite entreprise.

Mise en place d'un bon petit serveur, 4 disques, raid (5 | 10 | 6), contrôleur raid pci-e, un serveur de fichiers de base, ups (merci tomtom).

Le courrier destiné à quelques personnes seulement est probablement mieux traité par un fournisseur externe.

Restez à l'écart du SCE et d'autres situations de surenchère similaires, car vous devriez disposer d'un VPN, d'un Active Directory, etc. La mise en place de tout cela représente un effort considérable et n'est peut-être pas dans le meilleur intérêt de votre client.

En guidant votre petit client vers une solution simple, mais efficace et fiable, vous le rendrez et vous rendrez heureux.

Apprenez-leur à regarder les journaux d'événements, donnez-leur peut-être un simple script qui vérifie les avertissements de disque. Rendez-leur visite régulièrement, s'ils le souhaitent, et vérifiez les journaux pour eux. Traitez les problèmes un par un.

1voto

TomTom Points 50635

Ce n'est pas principalement un problème de matériel. Procurez-vous un USV - MAINTENANT. Un qui est ON LINE (c'est-à-dire qui filtre l'électricité).

En plus de cela, et je ne suis pas je n'embellis pas les choses, ils ont vu quatre défaillances matérielles cette année à ce jour

Il peut s'agir d'un phénomène comique - TRÈS rare - ou d'une fluctuation de l'alimentation électrique, par exemple, ou de quelque chose que le serveur n'a pas bien géré. Ce n'est PAS normal, et la probabilité que cela se produise "juste" est EXTRÊMEMENT faible. Comme les chances de gagner à la loterie. J'ai vu un comportement similaire - mais basé soit sur des alimentations CRAP ou... sur des alimentations instables avec des pointes, partiellement induites à la maison (j'ai vu des serveurs mourir lorsque vous allumez les lumières grâce à un très mauvais interrupteur où vous pouviez voir des étincelles).

  • Le SCE n'est pas nécessaire. WSUS est suffisant.
  • SBS ne prend pas vraiment en charge ce dont vous avez besoin en termes de disponibilité, mais vous pourriez essayer de l'exécuter sur une plate-forme de virtualisation. Il fonctionne dans Hyper-V... Je connais des gens qui le font à des fins de démonstration.

1voto

yota Points 141

Juste quelques idées supplémentaires :

  • Utilisez le RAID-6 au lieu du RAID-5+hot-spare. Avec le RAID-6, la parité est doublée sur les disques, ce qui permet à deux disques de tomber en panne en même temps. Ou utilisez simplement RAID-5, et ayez des sauvegardes DR qui fonctionnent.
  • Concentrez-vous d'abord sur la redondance à l'intérieur du boîtier du serveur (disques, alimentation électrique, refroidissement).
  • Acheter un service de support premium pour le boîtier du serveur, avec un accord de niveau de service (SLA) sur le temps de réponse en cas de panne matérielle (c'est beaucoup moins cher qu'une solution en grappe).
  • Acheter des (bons) UPS en ligne
  • Mettre en œuvre une solution de disponibilité basée sur la réplication, comme DoubleTake Availability. Il existe une version de DoubleTake Availability adaptée à Windows SBS qui est très bon marché. Vous aurez besoin de 2 serveurs pour cela, mais votre temps d'arrêt en cas de panne matérielle sera réduit à moins de 10 minutes.

0voto

Cyber Points 87

Je ne comprends pas quel problème le serveur est censé résoudre.

Si les quatre machines proviennent du même fournisseur et que votre emplacement n'a rien d'inhabituel (humidité/poussière très élevée, électricité statique, foudre ou alimentation électrique très peu fiable), vous devez trouver un nouveau fournisseur de matériel. Quoi que Dell, HP et IBM aient fait pour s'attirer les foudres du propriétaire, le fournisseur de ces machines est pire, du moins d'un point de vue matériel. Vous obtiendriez une meilleure fiabilité en achetant les machines les moins chères que vous pouvez trouver chez Wal-Mart.

Il se peut que ce ne soit pas entièrement la faute du fournisseur - peut-être que quelqu'un a spécifié un matériel particulier et/ou a insisté sur un équipement de très faible qualité - mais il aurait quand même dû refuser de construire des machines aussi mal configurées, ou bien faire quelque chose d'héroïque pour remplacer les mauvaises machines.

Je vous suggère d'acheter des PC de milieu de gamme de Dell/HP/Lenovo (ou de botter le cul du fournisseur actuel pour qu'il supporte ce qu'il a vendu), de souscrire à des comptes Dropbox payants (ou box.net, ou NetDocuments) pour partager des fichiers, et de laisser votre FAI ou Google gérer le courrier et les services web.

[Oui, les services "en nuage" sont théoriquement moins sûrs que le fait de posséder son propre serveur - mais si ce système est installé dans plusieurs bureaux à domicile, les données sont en danger si l'une de ces maisons est cambriolée, ou si un membre de la famille de quelqu'un utilise la machine de travail pour exécuter un logiciel malveillant aléatoire depuis Internet lorsque l'employé n'est pas chez lui ou est en vacances. Le plus grand danger de temps d'arrêt viendra des connexions Internet de niveau consommateur, et non de l'arrêt du fournisseur de cloud computing].

Il semble que vous ayez besoin de moins de matériel et d'un matériel plus simple si vous voulez être fiable, et non d'un matériel/logiciel plus compliqué et plus coûteux.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X