3 votes

L'interface de gestion de la PDU est peu disponible - défaut du produit ou problème isolé

Notre fournisseur de services de colocation nous a fourni des APC AP7932 Les PDU 0U commutées font partie de plusieurs armoires qu'ils nous fournissent. Nous avons eu beaucoup de problèmes avec l'aspect gestion de réseau de ces PDU, que je décrirai ci-dessous. Nous déménageons dans une cage dans le même centre de données et nous achèterons nos propres PDU pour la cage. J'aimerais savoir quelles unités PDU d'entreprise ont été fiables du point de vue de la gestion à distance, afin d'éviter d'acheter un produit qui semble bon sur le papier, mais dont l'utilisation est un cauchemar.

Nos PDUs fournies par les colocataires sont configurées pour prendre en charge la gestion via une interface web SSL et via telnet. Nous avons mis à jour le firmware de toutes ces unités avec la version actuelle de NOV2011. Elles répondent aux pings de manière fiable et nous n'avons aucune raison de suspecter un problème de couche réseau. Cependant, nous constatons fréquemment des blocages, des dépassements de délai, des déconnexions et une indisponibilité générale de l'hôte de gestion intégré dans toutes les PDU. Nous devons parfois redémarrer le microcontrôleur de la PDU pour récupérer ce qui semble être une panne occasionnelle. Les prises restent alimentées (heureusement), mais l'aspect gestion est si peu fiable qu'il est devenu une responsabilité opérationnelle - nous ne pouvons pas être sûrs que nous pourrions accéder à la PDU pour mettre hors tension un hôte si nous en avions besoin. Nous avons 3 PDU qui ont toutes le même comportement.

Il existe de nombreux fabricants d'unités PDU commutées 0U de qualité professionnelle, toutes dotées de caractéristiques comparables. Si j'examinais la fiche technique de nos unités PDU actuelles, elles sembleraient convenir - ce n'est qu'après avoir souffert en les utilisant que nous savons qu'il faut les éviter. J'aimerais éviter de choisir une unité PDU qui semble bonne sur le papier, mais qui présente des problèmes de fiabilité similaires.

Quelle est l'expérience d'autres personnes en matière d'UFC commutées ? Ce niveau de flocons est-il normal ?

2voto

ewwhite Points 193555

Ce que vous décrivez n'est pas normal, en quelque sorte. Cependant, comment déterminez-vous la disponibilité ? Disposez-vous d'une solution de surveillance qui envoie constamment des ping/problèmes à l'appareil ?

Dans le passé, j'ai OpenNMS pour collecter les données de mes appareils APC UPS et PDU. Certaines vérifications, en particulier les sondes http, ftp et telnet, provoquaient un dépassement du délai d'attente de l'interface de gestion, ce qui entraînait des coupures d'une durée de 30 à 60 secondes. C'est peut-être ce que vous constatez.

Je n'ai cependant jamais eu de problèmes avec la collecte SNMP. Si c'est le cas, essayez de réduire le nombre d'accès à l'interface de gestion et concentrez-vous uniquement sur la collecte de ce dont vous avez besoin.

Un extrait de mon tableau de disponibilité OpenNMS sur une interface APC enter image description here

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X