J'ai un serveur Dell 1U avec Intel(R) Xeon(R) CPU L5420 @ 2.50GHz, 8 cores exécutant Ubuntu Server Kernel Version 3.13.0-32-generic sur x86_64. Il est équipé de deux cartes réseau 1000baseT. Je l'ai configuré pour transmettre les paquets de eth0 à eth1.
J'ai remarqué que dans mon fichier kern.log, le système se bloque puis s'arrête. Cela se produit souvent. Cela se produit toutes les quelques secondes, puis cela peut aller pendant quelques minutes, puis à nouveau toutes les quelques secondes.
Voici le fichier journal :
[118943.768245] e1000e 0000:00:19.0 eth0: Detected Hardware Unit Hang:
[118943.768245] TDH <45>
[118943.768245] TDT <50>
[118943.768245] next_to_use <50>
[118943.768245] next_to_clean <43>
[118943.768245] buffer_info[next_to_clean]:
[118943.768245] time_stamp <101c48d04>
[118943.768245] next_to_watch <45>
[118943.768245] jiffies <101c4970f>
[118943.768245] next_to_watch.status <0>
[118943.768245] MAC Status <80283>
[118943.768245] PHY Status <792d>
[118943.768245] PHY 1000BASE-T Status <7800>
[118943.768245] PHY Extended Status <3000>
[118943.768245] PCI Status <10>
[118944.780015] e1000e 0000:00:19.0 eth0: Reset adapter unexpectedly
Voici les informations fournies par ethtool :
Paramètres :
Settings for eth0:
Supported ports: [ TP ]
Supported link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Supported pause frame use: No
Supports auto-negotiation: Yes
Advertised link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Advertised pause frame use: No
Advertised auto-negotiation: Yes
Speed: 1000Mb/s
Duplex: Full
Port: Twisted Pair
PHYAD: 1
Transceiver: internal
Auto-negotiation: on
MDI-X: off (auto)
Supports Wake-on: pumbg
Wake-on: g
Current message level: 0x00000007 (7)
drv probe link
Link detected: yes
Informations sur le conducteur :
ethtool -i eth0
driver: e1000e
version: 2.3.2-k
firmware-version: 1.4-0
bus-info: 0000:00:19.0
supports-statistics: yes
supports-test: yes
supports-eeprom-access: yes
supports-register-dump: yes
supports-priv-flags: no
Quelle en est la cause ? S'agit-il d'un simple bug dans le logiciel ou d'un problème matériel ? J'ai vu beaucoup d'autres personnes ayant des problèmes similaires mais aucune solution réelle et cela me laisse penser qu'il s'agit d'un problème de logiciel ?
Peut-être quelqu'un peut-il m'éclairer à ce sujet ?