59 votes

NVIDIA-SMI a échoué car il n'a pas pu communiquer avec le pilote NVIDIA. Assurez-vous que le dernier pilote NVIDIA est installé et fonctionne.

Je viens d'installer CUDA dans un ordinateur portable comme celui-ci :

sudo apt-get install cuda

Comme dit aquí .

La compilation fonctionne très bien mais quand j'essaie de l'exécuter, j'ai le problème suivant : CUDA error at file.cu:128 code=35(cudaErrorInsufficientDriver) "cudaStreamCreate(&(stream[i]))"

Ma version de nvcc :

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

Informations sur la carte graphique :

lspci | egrep 'VGA|3D'
00:02.0 VGA compatible controller: Intel Corporation Skylake Integrated Graphics (rev 06)
02:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 960M] (rev a2)

J'ai également installé VirtualGL, bumblebee-nvidia, primus, freeglut3-dev. Suivant ce .

Lorsque j'essaie d'exécuter quelque chose sur Bourdon, j'obtiens ceci : optirun glxspheres64

[   41.413478] [ERROR]Cannot access secondary GPU - error: Could not load GPU driver
[   41.413520] [ERROR]Aborting because fallback start is disabled.

Le pilote nvidia ne fonctionne pas.

nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

Il semble que la version nvidia 375 soit installée mais je n'arrive pas à la faire fonctionner.

whereis nvidia
nvidia: /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-375-375.66/nvidia

Et quelques informations sur le conducteur.

modinfo nvidia_375
filename:       /lib/modules/4.8.0-54-generic/updates/dkms/nvidia_375.ko
alias:          char-major-195-*
version:        375.66
supported:      external
license:        NVIDIA
srcversion:     68751AFD79A210CEFFB8758
alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
depends:        
vermagic:       4.8.0-54-generic SMP mod_unload modversions 
parm:           NVreg_Mobile:int
parm:           NVreg_ResmanDebugLevel:int
parm:           NVreg_RmLogonRC:int
parm:           NVreg_ModifyDeviceFiles:int
parm:           NVreg_DeviceFileUID:int
parm:           NVreg_DeviceFileGID:int
parm:           NVreg_DeviceFileMode:int
parm:           NVreg_UpdateMemoryTypes:int
parm:           NVreg_InitializeSystemMemoryAllocations:int
parm:           NVreg_UsePageAttributeTable:int
parm:           NVreg_MapRegistersEarly:int
parm:           NVreg_RegisterForACPIEvents:int
parm:           NVreg_CheckPCIConfigSpace:int
parm:           NVreg_EnablePCIeGen3:int
parm:           NVreg_EnableMSI:int
parm:           NVreg_TCEBypassMode:int
parm:           NVreg_UseThreadedInterrupts:int
parm:           NVreg_MemoryPoolSize:int
parm:           NVreg_RegistryDwords:charp
parm:           NVreg_RmMsg:charp
parm:           NVreg_AssignGpus:charp

Je pense que ça peut être un problème de version du pilote :

dpkg -l | grep nvidia
ii  bumblebee-nvidia                            3.2.1-10                                      amd64        NVIDIA Optimus support using the proprietary NVIDIA driver
ii  nvidia-375                                  375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary driver - version 375.66
ii  nvidia-375-dev                              375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary Xorg driver development files
ii  nvidia-modprobe                             375.51-0ubuntu1                               amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-opencl-icd-375                       375.66-0ubuntu0.16.04.1                       amd64        NVIDIA OpenCL ICD
ii  nvidia-prime                                0.8.2                                         amd64        Tools to enable NVIDIA's Prime

Qu'est-ce que je rate ?

2voto

MF.OX Points 139

Si vous êtes à la recherche d'une solution pour Plate-forme Google Cloud Si vous êtes un utilisateur de CUDA, il est préférable de suivre les conseils de Google et de n'utiliser que la version recommandée d'Ubuntu (au moment de la rédaction de mai 2020, utilisez la version 16.04 ou 18.04, la nouvelle version 20.04 n'étant pas encore prise en charge) et de suivre les instructions officielles pour l'installation du support CUDA pour Google Cloud VM. aquí . Cela vous donnera le version correcte du pilote qui fonctionne avec GCP VM. Puis redémarrez l'instance avec sudo reboot ou depuis la console.

Si vous installez CUDA pour GCP VM d'une autre manière, vous réussirez peut-être mais vous rencontrerez des problèmes comme " NVIDIA-SMI a échoué car il n'a pas pu communiquer avec le pilote NVIDIA. "ou un problème de dépendance.

PS ! Je ne copierai pas les instructions ici car elles sont susceptibles d'être modifiées à tout moment. Référez-vous toujours à la source originale de GCP pour obtenir la dernière solution fonctionnelle.

0voto

Tara Mishra Points 171

Beaucoup d'utilisateurs ont mentionné qu'ils ne parvenaient pas à installer le Nvidia-toolkit, et sudo apt install nvidia-cuda-toolkit ne fonctionne pas. Vérifiez que vous utilisez la dernière version du compilateur GCC. L'utilisation d'un compilateur GCC plus ancien comme 4.9 ne sera pas en mesure de compiler le Nvidia Cuda toolkit. Essayez d'installer après en utilisant le dernier compilateur GCC, tel que v9.3.

-1voto

Pour les futurs lecteurs :

Je suis sur une instance de machine virtuelle (Google Cloud Platform)

et je suis cette phrase pour installer Cuda y CuDNn sur ma VM.

J'ai dû télécharger manuellement le CuDNn partie. (Je le dis juste comme ça.)

Maintenant, j'arrive à l'erreur :

J'avais ce problème mais un redémarrage complet de l'instance a fait l'affaire. Et par redémarrage complet, je veux dire arrêter l'instance et la rallumer.

J'espère que cela aidera quelqu'un.

-1voto

Alex Lamson Points 166

J'utilisais la version 470 du pilote dans Ubuntu 20.04 (le dernier pilote au moment de la rédaction).

Je suis allé dans Logiciels et mises à jour>Pilotes supplémentaires, puis j'ai rétrogradé à nvidia-driver-460, j'ai cliqué sur Appliquer, puis j'ai redémarré.

Après cela, j'ai été en mesure de voir la sortie correcte à partir de nvidia-smi encore.

SistemesEz.com

SystemesEZ est une communauté de sysadmins où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X