5 votes

Augmentation soudaine et permanente de la tension d'entrée du CPU, de la température du cœur et de la vitesse du ventilateur sans augmentation correspondante de la charge.

L'un de mes serveurs présente des changements étranges dans ses paramètres de surveillance. Dimanche soir dernier, une des mesures de tension ( en0 ce qui, je pense, est Vcore ) a soudainement augmenté de 20%, passant de ~1V à ~1.20V en moyenne. Il y a une augmentation significative correspondante des températures du cœur du CPU et de la vitesse du ventilateur du CPU, mais une très légère augmentation de la fréquence du CPU (1.20GHz -> 1.25GHz) et de la charge de base du CPU.

Qu'est-ce que cela peut signifier ? Je soupçonne une défaillance du PSU ou du MB. Y a-t-il d'autres explications valables pour un tel comportement ? Il n'y a eu aucune modification du matériel du serveur, des paramètres du BIOS ou du logiciel à ce moment-là.

Le serveur MB est Gigabyte GA-MA69VM-S2 avec AMD Athlon(tm) Dual Core Processor 4450e. Le système d'exploitation est Ubuntu 12.04.2 LTS avec le noyau 3.2.0-45-generic. La surveillance est effectuée par lm-sensors 1:3.3.1-2ubuntu1. La sortie actuelle de la commande sensors est représentée par les graphiques ci-dessous.

voltagestemperaturesCPU fanCPU frequencyCPU load

k8temp-pci-00c3
Adapter: PCI adapter
Core0 Temp:   +38.0°C  
Core0 Temp:   +35.0°C  
Core1 Temp:   +35.0°C  
Core1 Temp:   +37.0°C  

it8716-isa-0228
Adapter: ISA adapter
in0:          +1.20 V  (min =  +0.00 V, max =  +4.08 V)
in1:          +1.89 V  (min =  +0.00 V, max =  +4.08 V)
in2:          +3.36 V  (min =  +0.00 V, max =  +4.08 V)
+5V:          +2.98 V  (min =  +0.00 V, max =  +4.08 V)
in4:          +3.07 V  (min =  +0.00 V, max =  +4.08 V)
in5:          +3.23 V  (min =  +0.00 V, max =  +4.08 V)
in6:          +0.10 V  (min =  +0.00 V, max =  +4.08 V)
5VSB:         +3.02 V  (min =  +0.00 V, max =  +4.08 V)
Vbat:         +3.02 V  
fan1:        1555 RPM  (min =    0 RPM)
fan2:        2860 RPM  (min =    0 RPM)
temp1:        +29.0°C  (low  = +127.0°C, high = +127.0°C)  sensor = thermistor
temp2:        +34.0°C  (low  = +127.0°C, high = +127.0°C)  sensor = thermistor
temp3:        +31.0°C  (low  = +127.0°C, high = +127.0°C)  sensor = thermal diode
cpu0_vid:    +1.200 V
intrusion0:  ALARM

4voto

Chopper3 Points 99341

De bonnes données/recherches etc. et cela ressemble exactement à ce que vous suggérez, quelque chose a forcé vcore de .2v - aucune idée pourquoi mais tout ce qui suit suit ce modèle - je suppose que vous n'avez pas de CPU de rechange à échanger pour voir si c'est la puce ou le VRM, n'est-ce pas ? c'est tout ce que je suggérerais vraiment, diviser le problème pour voir si le problème reste.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X