2 votes

nvidia-smi : décalage de la version de l'API du noyau

J'installe cuda-10.0 sur mon système ubuntu 18.04. J'ai suivi les instructions du site officiel : https://docs.nvidia.com/cuda/cuda-installation-guide-linux/

En exécutant les échantillons fournis avec cuda toolkit pour vérifier l'installation, j'obtiens l'erreur suivante :

/usr/local/cuda-10.0/samples/bin/x86_64/linux/release/deviceQuery Démarrage...

Version de CUDA Device Query (Runtime API) (liaison statique CUDART)

cudaGetDeviceCount renvoie 35 -> La version du pilote CUDA est insuffisante pour la version du runtime CUDA. Résultat = FAIL

J'ai lancé la commande "nvidia-smi" et j'ai obtenu le résultat suivant :

Échec de l'initialisation de NVML : Erreur inconnue

Voici le résultat de la commande "dmesg".

[4424407.320909] NVRM : non-concordance de l'API : le client a la version 440.82, mais le module du noyau a la version 4.1. NVRM : ce module du noyau a la version 440.44. Veuillez NVRM : assurez-vous que ce module de noyau et tous les pilotes NVIDIA NVRM : composants ont la même version.

[4426448.420756] NVRM : incompatibilité de l'API : le client a la version 340.108, mais le client n'a pas la version 340. NVRM : ce module du noyau a la version 440.44. Veuillez NVRM : assurez-vous que ce module noyau et tous les composants du pilote NVIDIA NVRM : composants ont la même version.

Résultat de la commande "cat /proc/driver/nvidia/version".

Version du NVRM : NVIDIA UNIX x86_64 Kernel Module 440.44 Sun Dec 8 03:38:56 UTC 2019

Version de GCC : gcc version 7.4.0 (Ubuntu 7.4.0-1ubuntu1~18.04.1)

Je l'installe sur un système distant auquel j'accède par ssh et AnyDesk (pour accéder à l'interface graphique). Existe-t-il une solution qui ne m'obligerait pas à redémarrer mon système distant ? Étant donné la situation actuelle de Corona, cela pourrait devenir problématique pour moi si je redémarre le système distant.

2voto

samarth.robo Points 21

Cela se produit lors de l'installation de pilotes Nvidia à partir d'un fichier .run téléchargé sur le site Web de Nvidia.

Ubuntu a un libnvidia-compute-4xx qui fournit une certaine version de la bibliothèque (440.82 dans votre cas). Le site nvidia-smi fourni par le fichier .run attend une version légèrement différente (440.44). La solution consiste à supprimer libnvidia-compute-4xx : # apt purge libnvidia-compute-4xx .

Tous les guides d'installation des pilotes Nvidia vous disent de supprimer les paquets apt en utilisant # apt remove nvidia* mais le libnvidia-compute-4xx échappe ce caractère générique, ce qui provoque ce problème de non-concordance des versions des bibliothèques.

J'ai trouvé cette solution en regardant les commandes de ce blog : https://blog.csdn.net/weixin_43825748/article/details/112979312 .

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X