142 votes

Le test de Joel pour les emplois d'administrateur système

D'après "Problèmes organisationnels" - points sensibles de l'informatique ? je pense qu'il serait juste de dire que les administrateurs système doivent déterminer si un endroit vaut la peine d'y travailler. Il existe un test similaire bien connu par Joel pour les programmeurs.

Quelles sont les 12 questions que les administrateurs système devraient poser lors d'un entretien pour les aider à décider s'il s'agit d'un bon endroit pour travailler ?

Suivant les règles de Joel :

  1. Les questions devraient être agnostiques en termes de plateforme et de technologie
  2. Les questions devraient susciter une réponse simple telle que oui ou non

EDIT : Veuillez poster une question à la fois afin que nous puissions voir ce que les utilisateurs votent.

2 votes

Question - devrions-nous mettre chaque question dans une réponse séparée afin d'avoir les 12 questions/réponses les plus votées ?

0 votes

Je pense que c'est probablement la meilleure façon de le faire.

2 votes

Le test de Joel utilise des questions oui/non, donc peut-être devrions-nous nous en tenir à ce type de questions au lieu des questions "comment" ou "décrire".

101voto

Guy Points 16718

Utilisez-vous un système de suivi des incidents/tickets ?

11 votes

Et un corollaire: prend-il en charge les e-mails et les conversations? Le système que nous utilisons ici répondrait "oui" à votre question, mais est proche d'une perte nette. Inévitablement, un rapport arrive et le service d'assistance ne pose pas les bonnes questions. Quelqu'un d'autre intervient alors, recueille des informations secondaires non documentées, résout le problème et ne fait aucun effort pour documenter cela. Au moins, avec un fil de discussion par e-mail ad hoc, vous vous retrouvez avec un historique de conversation cité.

1 votes

Cela peut être bon ou mauvais vraiment. Certains systèmes de tickets finissent par entraver presque tout autre travail avec des bureaux d'assistance qui escaladent constamment juste pour sortir le ticket de leur domaine.

0 votes

Vous avez besoin d'un système d'incident pour recueillir des statistiques sur les lieux et/ou les problèmes réels récurrents. C'est une bonne base pour réparer les systèmes défaillants et les rapports qui en découlent aident la direction à comprendre qu'il s'agit d'un problème valable avec lequel il faut composer.

80voto

v6ak Points 1125

Effectuez-vous des sauvegardes système et testez-vous régulièrement les restaurations ?

72voto

Jeff Thomas Points 183
  • Combien d'autres personnes travailleront aux côtés de moi dans les opérations quotidiennes?

Cela affecte directement votre capacité à travailler. Cela affecte également votre capacité à prendre des vacances sans interruption...

  • Qui est le premier intervenant en cas de problème?

Cette réponse peut varier, mais c'est un bon indicateur de la capacité d'organisation de l'entreprise. Les grandes structures doivent avoir un service d'assistance et un système de billetterie ; les petites structures doivent avoir au moins un système de billetterie, ainsi qu'un bip d'entreprise payé pour obtenir de l'aide.

"Juste vous" n'est pas une réponse acceptable. Cela témoigne d'un manque total d'organisation, et devrait être suivi de la question "Comment suivez-vous les demandes des utilisateurs?". Cette question doit recevoir une réponse, n'importe laquelle, autre que "vous ne le faites pas".

  • Quel est votre ratio de systèmes existants par administrateur?

Ce ratio ne devrait pas être trop élevé (au-dessus de 50:1) ou trop faible (en dessous de 5:1). Un ratio trop élevé signifie que votre charge de travail sera tellement élevée que vous aurez du mal à gérer la situation. Un ratio trop faible signifie que vous êtes soit le seul responsable, soit que l'entreprise a des problèmes graves dans sa gestion des systèmes.

Comme toujours, il y a des exceptions à la règle ; des situations où plus de 200 systèmes peuvent être clonés à partir d'une source unique (pensez aux serveurs web), et des situations où l'entreprise est très petite (20 employés pourraient n'avoir besoin que de 2 serveurs).

  • Quel est votre ratio d'utilisateurs clients par administrateur?

C'est une mesure des attentes. Ce sont vos "clients". Lorsqu'il y a des problèmes, vous serez sous pression pour résoudre la situation en fonction de ce ratio. Une entreprise de 5000 employés avec seulement 2 administrateurs peut être un endroit très stressant si vos systèmes rencontrent des problèmes.

  • Quel est votre ratio d'utilisateurs clients par systèmes existants?

C'est une mesure de la charge de travail des serveurs. Des ratios très élevés peuvent indiquer une surutilisation ou des contraintes budgétaires qui vous empêcheront d'agrandir vos systèmes. Une sous-utilisation peut également être un problème lorsque ce n'est pas justifié (par exemple, il est normal que le département des ressources humaines ait son propre serveur, mais un serveur de fichiers pour seulement 5 utilisateurs "réguliers" dans une entreprise de 5000 personnes est inquiétant) ; cela pourrait nécessiter une "virtualisation" pour regrouper les serveurs...

  • Existe-t-il un processus existant pour gérer les mises à jour des systèmes existants, telles que l'application de correctifs du fournisseur ou de mises à jour de firmware?

La réponse ne peut être ni "je ne sais pas", ni "nous ne mettons pas à jour".

  • Imaginons qu'un serveur prenne feu. Dans le cas d'une crise ou d'une calamité, quel délai de temps d'indisponibilité est acceptable?

C'est une question toujours raisonnable. Si l'intervieweur réagit mal à cette question, il ne comprend pas la nature de votre travail, un indice important sur les perspectives d'avenir. Si l'entreprise attend une disponibilité 24/7, c'est une chose - sauf si elle n'a pas l'infrastructure nécessaire, ce qui signifie que vous devrez surveiller les machines constamment. Savoir ce qui est acceptable ou non aide à comprendre les attentes réelles de l'entreprise.

  • En parlant d'incendie, avez-vous un système de lutte contre l'incendie en place pour vos équipements, et est-il du bon type?

Les gicleurs à eau ne sont pas une réponse acceptable. Cela peut arriver, et vous pourriez vous retrouver avec des entreprises qui pensent qu'il est judicieux de placer une armoire serveur sans ventilation dans un placard avec un gicleur au-dessus. Si cette question est minimisée, ignorée ou rencontre de l'hostilité, levez-vous, remerciez l'intervieweur et partez en courant...

  • Décrivez votre processus de sauvegarde des données et le format de stockage utilisé.

C'est une autre question à laquelle on ne devrait pas répondre par "nous ne faisons pas de sauvegarde" ou "nous n'avons pas de support de sauvegarde".

  • Testez-vous vos sauvegardes régulièrement, et à quelle fréquence?

Il s'agit du suivi de la question précédente. Si vous ne testez pas régulièrement vos sauvegardes, vous risquez des problèmes potentiels.

  • Disposez-vous d'un budget connu et d'un processus d'achat pour les investissements et les achats mineurs? Pouvez-vous m'expliquer le processus que je devrais suivre pour acheter quelque chose?

Si la réponse est "nous (quelqu'un d'autre) l'achèterons lorsque nous en aurons besoin", c'est inquiétant. Cela signifie "nous ne vous faisons pas confiance pour acheter l'équipement au moment où vous en avez vraiment besoin, nous préférons que quelqu'un d'autre le fasse à votre place". Il devrait toujours y avoir un certain budget.

Le processus d'achat devrait être assez simple à expliquer en moins de 2 minutes. Il ne devrait pas impliquer plus de 2 parties prenantes (un nombre plus élevé indique de la bureaucratie), et le délai devrait être mesuré en jours ou en heures, pas en semaines (les achats urgents seront retardés s'ils prennent trop de temps). Il devrait toujours y avoir un processus.

  • Avez-vous un plan pour renouveler et recycler votre ancien matériel, et à quelle fréquence cela se produit-il?

J'ai déjà vu des entreprises fonctionner avec des mini-ordinateurs de 18 ans gardés en vie par des contrats de support et beaucoup de pièces de rechange d'un fournisseur de support. Bien sûr, le fournisseur initial a depuis longtemps disparu...

Les unités de bureau ne doivent jamais être remplacées plus souvent qu'après 3 ans, ni plus lentement qu'après 5 ans. Dans les entreprises avec des budgets serrés, prolonger la durée de vie des unités de bureau jusqu'à 5 ans est parfois une réponse appropriée.

L'aspect du recyclage est un test pour savoir si l'entreprise adopte une attitude "jetable" envers son ancien matériel. Il est mauvais de ne pas disposer correctement du matériel en le faisant recycler par une entreprise spécialisée, mais c'est bon dans le sens où vous pouvez récupérer du matériel ancien en cas de besoin temporaire. Cela vous donnera également une idée de la taille de leur "cimetière" (la pile de vieux matériels conservée à des fins diverses).

Questions connexes :

https://serverfault.com/questions/44638/how-often-does-tech-refresh-happen

5 votes

Belle réponse complète. Le "rafraîchir et recycler" est une question amusante à poser aussi aux serveurs; vous ne voulez pas aller dans un magasin où vous passez la plupart de votre temps à soigner d'anciens serveurs, n'est-ce pas?

0 votes

Il y a tellement de bons points ici, auriez-vous la possibilité de les découper et de les reposter comme des réponses séparées afin que nous sachions comment la communauté priorise chaque élément?

0 votes

Étrange... Y a-t-il un bug sur SO qui permet aux utilisateurs ayant 170 rep de modifier une réponse mais de ne pas avoir l'édition visible ? serverfault.com/users/9113/joshperry a apporté une modification de deux lignes en bas, mais je pensais que lorsqu'une personne apportait une modification, on pouvait voir publiquement qui c'était...

49voto

Guy Points 16718

Avez-vous un plan de reprise après sinistre et est-ce que cela inclut l'informatique ?

Suites des excellents commentaires : Si oui, est-ce que cela inclut l'ensemble de l'organisation et pas seulement l'informatique ? Est-ce que cela inclut le personnel et est-ce que vous le testez régulièrement ?

Questions connexes :

Développement des meilleures pratiques ou ressources pour un plan de reprise après sinistre ?

4 votes

Et sont-ils conscients que la reprise après sinistre (DR) n'est pas seulement un problème informatique? Beaucoup d'endroits considèrent sérieusement la reprise après sinistre uniquement en termes d'informatique, et n'ont pas de plans pour leurs archives papier.

0 votes

Oui, tellement vrai - bien que j'aie trop souvent vu le contraire aussi : il y a de grands plans pour relocaliser la direction exécutive et les employés clés en cas d'inutilisabilité du bureau - mais aucun pour faire en sorte que l'informatique fonctionne, ce qui est vraiment absurde lorsque la salle des serveurs se trouve dans le même bureau que le plan de catastrophe prévoit, mais encore une fois, ils avaient d'excellentes routines manuelles pour tout - ce qui leur permettait de gérer les interruptions informatiques de courte durée.

4 votes

La réponse "oui, nous sommes entièrement assurés" n'est pas une réponse valide.

40voto

JFV Points 751

L'environnement actuel est-il documenté?

Les politiques et procédures sont-elles documentées et cohérentes?

0 votes

"Si j'étais embauché demain, et que le reste de mon équipe 'gagnait à la loterie' (ou 'mourait dans un accident étrange') à midi demain, la documentation serait-elle suffisante pour que je gère l'environnement?" A.K.A. La documentation est-elle correcte? VRAIMENT correcte? -Waldo"

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X