51 votes

Sur un serveur à double processeur, est-il normal qu'un processeur fonctionne plus chaudement que l'autre ?

J'ai un serveur dual Opteron fonctionnant sous Linux avec libvirt pour héberger plusieurs machines virtuelles. Les machines virtuelles fonctionnent bien et les processus du serveur sont corrects, mais je remarque que l'un des processeurs tourne toujours à 69°C (avec un étranglement à 70°C) et que l'autre tourne à 15°C environ.

Cela ne me semble pas normal. Les deux ne devraient-ils pas être un peu plus proches en température ?

Je ne sais pas comment faire pour aller plus loin dans la dianose. Peut-être qu'il n'y a pas assez de pâte thermique sur l'un des processeurs ?

Edit : La carte mère est ASUS KGPE-D16 et refroidie par un double Ventilateurs Noctua NH-U9DO .

Notez que je pense que les températures pourraient être des degrés au-dessus de la température ambiante, plutôt que des valeurs absolues ? Lorsque le serveur tourne au ralenti, les températures du CPU chutent à 2C et 13C. J'utilise la configuration lmsensors de aquí

108voto

nshew13 Points 101

Le problème s'est avéré être un dissipateur thermique mal adapté. Peut-être qu'un mauvais ajustement n'est pas la bonne description. Il s'avère qu'il faut mettre de la pâte thermique sur le dissipateur, et non sur le couvercle en plastique qui le recouvre.

enter image description here

Après avoir retiré le couvercle en plastique, le processeur est bien refroidi, merci à tous !

25voto

MadHatter Points 77602

D'après mon expérience, il est normal que des composants appariés dans un boîtier fonctionnent à des températures différentes, car le flux d'air n'est pas le même partout. Voici un graphique de la température des disques durs de mon boîtier colo. Les disques sont en miroir, donc les charges de travail sur eux sont presque identiques.

munin graph of HDD temps over past year

Comme vous pouvez le constater, ils se suivent, mais ne sont pas identiques ; en outre, l'écart entre eux n'est que de 6°C en moyenne. Que vos capteurs indiquent une température absolue ou une surchauffe, une différence de 55°C sous charge semble très mauvaise. Si vous êtes sûr que les données sont correctes, alors étant donné que la différence au repos tombe à 10C, ce qui est le genre de différence que je vois en raison du flux d'air, je soupçonnerais un dissipateur thermique mal ajusté.

8voto

TomTom Points 50635

Ce n'est pas le cas. À moins que vous n'ayez de sérieux problèmes de circulation d'air. Ou que l'un des refroidisseurs soit défectueux. La température variera, mais pas tant que ça (70 contre 15 degrés Celsius).

Etant donné que le degré 15 est très bas, je suppose que (a) votre capteur est éteint (vous stockez vraiment le serveur dans une pièce aussi fraîche ?)

Je suppose également que l'une des unités centrales de traitement ne fonctionne tout simplement pas, pour une raison quelconque.

Les petites différences sont normales. D'autres, plus importantes, peuvent l'être (je pense notamment à la circulation de l'air), mais nous parlons ici d'un appareil qui est FROID.

2voto

JamesRyan Points 8138

Il peut s'agir d'un refroidissement ou d'une charge inégale (compte tenu de la différence de température, il s'agit probablement d'une charge inégale). Vous devriez utiliser quelque chose comme prime95 pour charger tous les cœurs de manière égale et voir si les températures varient encore. Si ce n'est pas le cas, vous devez équilibrer les VM, vérifier que vos applications sont multithreadées et occupées. La façon de procéder dépend de votre logiciel et de votre charge de travail individuelle, ce qui dépasse le cadre de la question. Gardez à l'esprit qu'il n'y a pas d'avantage réel à faire cela si vous n'avez pas assez de charge pour faire tourner à plein un seul cpu/core, en fait votre VM peut délibérément éviter d'utiliser un second cpu pour pouvoir passer en mode d'économie d'énergie sur les systèmes multi-cpu.

Si vous avez réduit le problème au refroidissement. Une petite différence de 10C peut être due à une quantité insuffisante (ou trop importante !) de pâte thermique. Une différence plus importante indique un problème significatif ou une différence entre les refroidisseurs de processeurs. Il se peut que l'un d'entre eux ait bloqué le flux d'air, qu'un dissipateur thermique se soit détaché, etc.

0voto

Nikolay Frantsev Points 534

Je dirais que le capteur de température est défectueux, car 15°C, c'est seulement 59°F ! A moins que l'ordinateur ne se trouve dans un centre de données extrêmement glacial, j'imagine que la température de l'air ambiant est plus élevée que 59F ! Essayez d'assigner les VM au noyau à basse température et voyez s'il y a un changement ; si ce n'est pas le cas, je soupçonnerais fortement le capteur d'être défectueux.

Vous pouvez également consulter le résultat de l'application dmesg (messages de démarrage) et voir s'il y a quelque chose qui sort de l'ordinaire.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X