466 votes

Quelque chose brûle dans la salle des serveurs; comment puis-je identifier rapidement ce que c'est?

Un autre jour, nous avons remarqué une terrible odeur de brûlé sortant de la salle serveur. En résumé, il s'est avéré qu'un des modules de batterie brûlait dans l'unité UPS, mais il nous a fallu plusieurs heures avant de parvenir à le découvrir. La principale raison pour laquelle nous avons pu le découvrir est que l'affichage de l'UPS a finalement montré que le module devait être remplacé.

Le problème était le suivant : toute la salle était imprégnée de cette odeur. Faire un test olfactif était très difficile car l'odeur s'était infiltrée partout (sans compter qu'elle nous rendait un peu étourdis). Nous avons presque par erreur arrêté notre serveur de base de données de production car c'est là que l'odeur était la plus forte. Les données vitaux semblaient être correctes (les températures du processeur montraient 60 degrés Celsius et les vitesses des ventilateurs étaient correctes), mais nous n'étions pas sûrs. Le module de batterie qui avait brûlé était presque à la même hauteur que le serveur sur le rack et à seulement 3 pieds de distance. Si cela avait été une véritable urgence, nous aurions lamentablement échoué.

De manière réaliste, il est assez rare que du matériel serveur réel brûle, la plupart du temps nous devrons regarder du côté de l'UPS comme coupable. Mais avec plusieurs racks contenant plusieurs équipements, cela peut rapidement devenir un jeu de devinette. Comment déterminer rapidement et avec précision quel équipement est en train de brûler? Je réalise que cette question dépend fortement des variables environnementales telles que la taille de la salle, la ventilation, l'emplacement, etc., mais toute contribution serait appréciée.

34 votes

@DeerHunter Eh bien, merci que ce soit la fin de la journée et qu'il y ait très peu de personnes dans le bâtiment. Merci pour vos critiques constructives, et je vais certainement informer mon superviseur des vies qu'elle a risquées en décidant de maintenir le système en marche.

12 votes

@hydroparadise - quelqu'un doit avoir le courage de dire "STOP Nous ne faisons pas les choses correctement". Si votre superviseur ne comprend pas les règles de sécurité, il n'y a pas vraiment grand-chose à faire, à part se montrer courageux et ne pas succomber à la tentation de prendre des raccourcis.

114 votes

@DeerHunter: Quelle serait la réponse appropriée lorsque vous sentez une odeur de brûlé? Il n'y a pas de fumée visible, juste une odeur de brûlé. Est-ce que vous éteignez l'ensemble du datacenter, le ventilez pendant quelques heures, puis rallumez les serveurs un par un jusqu'à ce que l'odeur revienne? Un petit datacenter de 25 racks pourrait compter jusqu'à 1 000 serveurs à vérifier, c'est beaucoup de temps d'arrêt pour une "odeur" - l'utilisateur initial n'a pas signalé de fumée ou de feu visible.

40voto

Malcolm Points 409

En tant que personne dont la carrière précédente était dans le domaine de la technologie électronique, j'ai de l'expérience avec les "odeurs de brûlé" qui n'étaient pas des incendies. Ce n'est pas rare.

Je ne fermerais pas un centre de données pour une odeur. La fumée est une autre affaire, quelque chose brûle vraiment (généralement, mais un condensateur au tantale de la taille d'un pois peut remplir une pièce de fumée aussi). C'est incroyable combien une composante grillée dans une alimentation peut dégager d'odeur.

Un Thermomètre à infrarouge (un outil utile et beaucoup moins cher qu'une caméra thermique) ne le montrerait pas nécessairement car la composante ne génère pas beaucoup de chaleur du tout et elle est à l'intérieur d'un boîtier. Mais vérifiez les dispositifs qui ne fonctionnent pas, utilisez vos outils de surveillance. Pour une odeur comme ça, 95% du temps, il s'agit d'une alimentation affectant les performances de tout le dispositif.

4 votes

+1, les alimentations électriques grillées sont courantes. Dans la plupart des centres de données avec des débits d'air élevés, la fumée est rapidement évacuée et il est difficile de localiser la source de l'odeur. Dans une petite pièce en revanche, l'odeur peut être assez désagréable et se répandre rapidement dans toute la pièce.

18voto

andyczerwonka Points 1750

J'aime les réponses en imagerie IR ou thermomètre mais peut-être ce qui pourrait aussi aider est un véritable "détecteur d'odeurs". Après tout, ce qui a déclenché votre prudence était l'odeur. La fumée, la chaleur, l'IR, etc. sont tous des substituts.

Quelque chose comme celui-ci: de Shinyei. Personnellement, je ne les ai jamais utilisés ni même vu les utiliser dans un datacenter. Mais au moins théoriquement, cela devrait être un outil intéressant. Si vous avez de l'argent à dépenser pour ce gadget-là.

http://www.sca-shinyei.com/odormeter ou http://www.intopsys.com/products/cyranose.html?gclid=CNXXzOrLs7YCFUws6wodViYApQ

Il vous donne une force et une classification des odeurs. Donc se concentrer sur l'odeur devrait être possible. Le diable est dans les détails bien sûr. À quel point il est sensible, comment masquer une odeur de fond apparemment fausse, etc.

Un avantage par rapport aux mesures basées uniquement sur la température est que souvent l'odeur se produit à un stade ou seuil bien plus précoce. Ou si le composant surchauffé est caché par un corps / un câblage dissimulé, il est plus facile de détecter des molécules en fuite qu'un point chaud en ligne de mire.

Une autre situation est une odeur non liée à la chaleur. Nous avons eu une fuite dans un circuit de refroidissement auparavant et les odeurs du liquide de refroidissement étaient aussi particulières. Je ne vais même pas parler du cas maintenant ancien d'un rongeur mort dans les gaines. :)

J'ai été surpris de la sensibilité de ces capteurs. Apparemment, le H2S / les mercaptans, etc. (les suspects habituels) sont détectables à des niveaux inférieurs au ppm.

entrer la description de l'image ici

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X