40 votes

Quelle est votre liste de contrôle lorsque tout explose?

Les utilisateurs ne peuvent pas accéder à leur e-mail, le PDG ne peut pas accéder à la page d'accueil de l'entreprise et votre pager vient de sonner avec un code "911". Que faites-vous lorsque tout explose?

59voto

Edward Luong Points 108

Garde ton calme

Ne panique pas. Respire ! (Depuis le diaphragme, ça aide.) Si vous avez étudié la méditation, cela peut aussi aider.

Lorsque confronté à un stress extrême, votre corps entrera en mode fuite ou combat, car votre corps pense être dans une situation de vie ou de mort. À ce moment-là, votre corps pompera effectivement moins de sang vers certaines parties de votre cerveau, réduisant les fonctions comme le raisonnement. Cela diminue en fait votre QI car l'instinct, plutôt que la rationalité, commence à dominer vos fonctions cérébrales. Si vous avez déjà été dans une dispute animée ou en avez été témoin, vous pouvez reconnaître ces symptômes alors que les émotions des gens s'enflamment et que la rationalité prend des vacances. Plus tard, lorsque les gens ont la possibilité de se calmer, ils seront plus susceptibles d'accepter d'avoir commis une erreur ou d'avoir eu tort, et seront plus capables de voir l'autre côté, mais sur le moment, moins.

Maintenir votre sang-froid et garder vos esprits vous permettra de maintenir votre cerveau fonctionnant à pleine capacité et de vous assurer de prendre des décisions rationnelles basées sur des preuves et la raison plutôt que sur l'émotion et la peur.

Triage

L'application efficace des ressources limitées pour obtenir le plus grand bénéfice au plus faible coût est extrêmement important ici. Prenez les décisions le plus tôt possible quant aux choses qui doivent être réparées DÈS MAINTENANT, celles qui peuvent attendre un peu (heures, jours), et celles qui peuvent attendre indéfiniment. Apprenez également à reconnaître quand quelque chose est irrécupérable et ne vaut pas la peine d'être sauvegardé (par exemple, si la moitié du routeur a fondu, même si c'est le seul que vous avez, vous ne pouvez pas le sauver, achetez-en un nouveau et obtenez-le sur place le plus rapidement possible ou trouvez quelque chose qui peut combler temporairement le vide).

Conserver la conscience de la situation

Ne laissez pas votre attention être piégée par un problème intéressant ou par quelque chose que vous ne comprenez pas encore. Restez concentré sur le tableau d'ensemble et sur le fait de faire fonctionner les choses les plus importantes.

Utiliser la méthode scientifique

Formulez une hypothèse. Déterminez comment vous testeriez cette hypothèse. Rassemblez des données pour tester l'hypothèse. Recherchez également des données qui pourraient la contredire. Affinez votre hypothèse et répétez le cycle autant de fois que nécessaire jusqu'à ce que vous ayez suffisamment confiance en votre hypothèse pour agir.

Être pragmatique

Ce n'est pas le moment pour le dogme. Il est acceptable de prendre quelques raccourcis ici et là lors de la récupération d'une catastrophe. Cela revient essentiellement à accumuler de la dette technique. Dans de nombreuses entreprises, une défaillance catastrophique signifie une perte de revenus catastrophique. Il vaut mieux remettre les choses en marche, même sur des bases fragiles, que de tergiverser et risquer les moyens de subsistance de votre entreprise. Comme toujours, le jugement est extrêmement important ici. Parfois, il est logique de soutenir un ventilateur orienté vers une armoire de serveur, parfois non.

Prenez soin de vous

Depuis combien de temps travaillez-vous sur cette urgence? Quand avez-vous bu de l'eau pour la dernière fois? Quand avez-vous mangé pour la dernière fois? Depuis combien de temps êtes-vous éveillé? Ne vous épuisez pas juste parce qu'il y a une urgence, prenez le temps de rester hydraté, nourri et reposé (au cas où ce serait un long combat de plusieurs jours).

Recruter de l'aide

Il y a presque certainement de nombreuses personnes talentueuses dans votre entreprise qui sont à la fois motivées et capables de vous prêter main-forte. Méfiez-vous d'avoir trop de personnes qui courent partout et se causent des ennuis mutuels. Méfiez-vous également d'ennuyer les gens en les soumettant à un "exercice d'incendie". Trouvez des personnes qui veulent déjà aider, faites-les travailler sur des tâches ciblées et assurez-vous que les gens communiquent entre eux.

Communiquer

La communication est cruciale. Rien n'est aussi effrayant que l'inconnu. Lorsque les gens ne savent rien d'autre que quelque chose est cassé, une affirmation vide selon laquelle tout sera de nouveau en état dans X heures est seulement légèrement rassurante (encore moins rassurante après que X heures se soient écoulées et que les choses sont toujours cassées). Les pressions en jeu peuvent vous pousser à donner des estimations de temps WAG excessivement optimistes, mais c'est la mauvaise voie. Ne dites pas seulement que vous travaillez dessus, ne dites pas seulement que les choses seront réparées d'ici telle heure. Soyez ouvert, montrez votre processus, détaillez vos progrès et vos revers. Donnez un aperçu du problème, de votre processus pour le résoudre et de votre plan pour réparer les choses (mais ne noyez pas les gens dans les détails). Montrez que le problème n'est pas insurmontable, montrez que les choses seront réparées tôt ou tard, montrez qu'il y a des personnes compétentes sur le problème, ces éléments sont plus rassurants que des promesses vides de délais.

35voto

Mat Points 2512

La première réponse est de rester calme! J'ai appris à la dure que paniquer ne fait souvent qu'empirer les choses. Une fois cela accompli, la prochaine étape est en fait de déterminer quel est le problème. Les plaintes des utilisateurs et des gestionnaires vous arriveront de tous les côtés, vous disant ce qu'ILS ne peuvent pas faire, mais pas quel est le problème.

Une fois que vous connaissez le problème, vous pouvez commencer à planifier sa résolution et donner à vos utilisateurs mécontents un calendrier!

24voto

Matt Blaine Points 2270

Ne paniquez pas.

22voto

Dave Cheney Points 18132

Étape 0. Vérifiez que ce n'est pas votre système de surveillance qui est en cause

11voto

blcArmadillo Points 1872

Réservez immédiatement un vol pour un pays sans extradition

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X