1 votes

Alertes de Sun LOM

Je surveille le matériel Sun en utilisant SNMP pour recueillir des informations à partir de la carte LOM. L'un des points de données que je surveille est une MIB d'état de tension qui alerte si l'une des tensions internes devient trop élevée ou trop basse - les seuils étant probablement définis par Sun au moment de la fabrication. Ces alertes se déclenchent avec une fréquence surprenante - y a-t-il lieu de s'inquiéter ?

0 votes

Quel est le modèle de matériel utilisé ? De plus, est-ce que le LOM enregistre les erreurs en plus de votre surveillance SNMP dans le journal des événements internes ?

0 votes

Il s'agit de machines SunFire X2100 et X2200. Rien n'est enregistré dans le journal des événements sur ces LOM.

1voto

Christian Studer Points 464

Nous avons vécu la même chose. Apparemment, il n'y a pas lieu de s'inquiéter. Les tensions varient au fur et à mesure que la batterie de secours embarquée se charge et se décharge.

Un mot sur les Sun LOM, le firmware de certains modèles a été mis à jour mensuellement pendant des années. Il est évident qu'ils les mettent à jour pour une raison précise. Si vous ne l'avez pas encore fait, il serait bon de télécharger la dernière et la meilleure version.

0 votes

De quelle batterie embarquée parle-t-on ici ?

0 votes

Désolé, je pensais au Sun StorEdge. La plupart des LOM ont juste une petite batterie de type montre. Les mises à jour du firmware sont toujours aussi rapides et furieuses et les alertes de tension snmp fallacieuses, cependant.

1voto

fr00ty_l00ps Points 233

J'ai dû gérer un certain nombre de serveurs Sun XFire et j'ai rencontré des problèmes similaires. Au moment de l'achat, ces serveurs étaient équipés de l'embedded Lights out Manager (eLOM), et après la mise à niveau vers l'integrated Lights out Manager (iLOM), beaucoup de ces problèmes ont été résolus, et de nombreuses fonctionnalités ont été ajoutées. Les différences de noms sont déroutantes, mais je recommande vivement la mise à niveau vers le dernier et meilleur firmware pour LOM et BIOS si vous pouvez vous permettre le temps d'arrêt.

1voto

Il existe plusieurs seuils dans le système, il peut donc être utile d'examiner les seuils qui sont dépassés. En regardant un dump d'état d'un X4200, je vois upper/lower_noncritical_threshold, upper/lower_critical_threshold, et upper/lower_nonrecov_threshold. Étant donné que le LOM n'enregistre pas l'erreur, je soupçonne que vous êtes en train de regarder une requête qui montre des choses qui atteignent les limites non critiques. Pour les transitoires dans cette gamme, il n'y a probablement rien à craindre.

Je vais également appuyer les autres réponses concernant les mises à jour du micrologiciel. Il y a eu d'importantes mises à jour de l'ILOM et du BIOS depuis que les X4x00 sont sortis, et je soupçonne que les X2x00 ont aussi des mises à jour.

0 votes

+1 pour les mises à jour du firmware

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X