2 votes

Diagnostiquer les défauts du réseau

Clause de non-responsabilité : je suis un développeur, pas un administrateur système, veuillez être indulgent.

Là où je travaille, nous avons beaucoup de problèmes de réseau intermittents. Parfois le DNS échoue, mais l'accès aux serveurs peut se faire par IP, parfois l'accès par IP échoue. Pour autant que nous le sachions, rien n'a été modifié sur les serveurs, les pare-feu, les commutateurs gérés, etc. De plus, il est frustrant de constater que les pannes ne causent pas toujours des problèmes à tous les utilisateurs, mais pour autant que nous le sachions, tous les utilisateurs ont eu des problèmes à un moment ou à un autre.

  1. Les serveurs ne signalent aucune défaillance.
  2. Le réseau physique semble correct (il s'agit d'un petit site).
  3. Les pare-feu ne signalent rien d'anormal.
  4. Les commutateurs gérés ont des mots de passe qui ne sont stockés que dans la tête de l'administrateur système (un problème que nous connaissons !).

Notre administrateur système interne n'est pas disponible pour le moment, c'est donc aux développeurs d'essayer de trouver une solution.

Alors, étant donné que je n'en sais presque rien, par où commencer ?

更新情報

J'ai essayé le combo tracrt/ping et il semble que ce soit un problème interne. La partie externe semble être assez cohérente, mais les parties internes s'avèrent être instables.

2voto

Antitribu Points 1709

Traceroute vers un site internet dont vous savez qu'il sera actif, par exemple google.com. Puis lancez un ping constant contre 3 cibles, votre routeur, la passerelle par défaut de votre routeur et google.com.

Cela devrait au moins vous indiquer si vous perdez des paquets en cours de route ou si c'est votre réseau Internet ou interne qui a un problème.

Après cela, revenez nous voir si/quand vous aurez la réponse suivante.

On dirait qu'il y a une perte de connexion quelque part.

Le meilleur conseil serait de retrouver votre administrateur système, c'est pour cela qu'il/elle est là...

1voto

Salamander2007 Points 2242

On dirait que vous avez soit une mauvaise interface sur un commutateur/serveur, soit une source de trafic non autorisée sur le réseau. Sans la possibilité de capturer du trafic étendu ou de voir les statistiques de l'interface, il serait presque impossible de trouver l'un ou l'autre. Avez-vous ajouté de nouveaux appareils récemment ? En particulier, dans mon ordre personnel de dispositifs suspects : les périphériques réseau, les serveurs connectés à plus d'un réseau, les imprimantes.

Cependant, un administrateur système isolé qui part en vacances et laisse l'atelier sans visibilité sur le réseau est une très mauvaise situation. Il y a des choses à discuter à son retour :

  1. le suivi - il existe de nombreux solutions de surveillance gratuites/OSS pour tout, des statistiques par port (Cacti) à la surveillance approfondie des services (Nagios). Il semble que vous avez besoin des deux.
  2. documentation - si vous n'en avez qu'une personne qualifiée pour administrer le réseau, alors cette personne doit document, document, document ! Sur En outre, il doit être sur un support qui soit facilement accessible même si le réseau est en panne ! Cela inclut le stockage sécurisé des mots de passe, même s'il s'agit d'une copie papier conservée dans un coffre-fort, afin que l'entreprise ne souffre pas, même si l'administrateur système se fait écraser par le bus noir.
  3. notification - une fois que vous avez mise en place d'une solution de surveillance de surveillance, vous devez décider d'un plan d'escalade afin de ne pas notifications à une seule personne. personne.

J'ai été l'unique administrateur réseau d'une entreprise de plusieurs millions de dollars pendant plus de 7 ans (j'ai des sous-fifres maintenant =) et j'ai été de garde 24/7/365 pendant presque toute cette période et je peux dire, de manière assez définitive, que si vous vous êtes fait la seule personne à pouvoir faire une certaine chose, vous pouvez être assuré que vous sera être appelé chaque fois que cette chose doit être faite.

La seule chose sur laquelle vous pouvez compter à 100 %, c'est la probabilité que tout ce qui peut se casser quand vous êtes le seul à pouvoir le réparer est la chose qui est absolument garantie de se casser quand vous partez en vacances.

0voto

RainyRat Points 3680

Sans accès à vos commutateurs, vos options sont un peu limitées dans la recherche des problèmes de réseau. Je commencerais par vérifier les interfaces sur les serveurs ; recherchez les paquets abandonnés ou les collisions. Vous pouvez également utiliser Wireshark ou tcpdump pour examiner le trafic réel et voir ce qui se passe lorsque vos serveurs DNS ne parlent pas, mais tout cela est plus efficace lorsque vous pouvez surveiller les choses du côté réseau plutôt que du côté serveur. Si vous vraiment Si vous en avez besoin, vous pouvez réinitialiser les mots de passe sur les commutateurs, mais préparez-vous à faire face à la colère de votre administrateur quand il reviendra...

0voto

Kyle Brandt Points 81077

Isolez le problème :
Le mieux que vous puissiez faire est d'essayer d'isoler le problème, je pense. Si vous avez plusieurs commutateurs, les problèmes surviennent-ils sur des machines connectées à un seul de ces commutateurs ? Si le problème se produit sur tous les commutateurs et qu'il ne s'agit pas uniquement d'un problème de DNS, je me pencherais alors sur le routeur ou sur la connexion entre les commutateurs et le routeur. Il est possible qu'il s'agisse d'un problème de type "broadcast storm", mais c'est moins probable, et vous ne pourrez probablement pas le résoudre si c'est le cas. Comme cela a été mentionné, tcpdump/wireshark et les erreurs d'interface peuvent également aider dans ce processus.

Power Cycle Everything ( Risqué ) :
Un deuxième risqué L'option la plus simple est de tout mettre hors tension, ou d'éteindre les choses une par une pour voir si cela résout le problème. Je dis que c'est risqué car avec beaucoup d'équipements réseau, il y a une configuration en cours d'exécution, et une configuration sauvegardée. Si l'administrateur a oublié de commit la configuration courante à la configuration de démarrage la dernière fois qu'il a fait quelque chose, vous aurez probablement des problèmes après le redémarrage.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X