V20beta,安装nvidia-docker后测试cuda报错,找不到libnvidia-ml.so
Tofloor
poster avatar
flanker_e
deepin
2020-05-07 01:22
Author
本帖最后由 flanker_e 于 2020-5-6 17:25 编辑

小白,刚入linux的门
如题,在安装Nvidia显卡驱动(以及大神的nvidia-prime方案,文中其实有说过有风险)后

尝试安装了debian分支的docker

然后安装了debian10分支的nvidia-container-toolkit
然后根据官方建议用nvidia -smi测试cuda官方image之后报错
sudo docker run --gpus all nvidia/cuda:10.0-base nvidia-smi

NVIDIA-SMI couldn't find libnvidia-ml.so library in your system. Please make sure that the NVIDIA Display Driver is properly installed and present in your system.
Please also try adding directory that contains libnvidia-ml.so to your system PATH.
因为是小白,目前都是根据论坛以及网上的文章七拼八凑装起来的,完全不知道哪里出现了问题(甚至不知道有没有发对版块)希望能得到前辈指点



Reply Favorite View the author
All Replies
avatar
flanker_e
deepin
2020-05-12 06:28
#1
解决了
应当是镜像中无法检索到libnvidia-ml.so文件,所以要找到这个文件的路径(如果存在的话),在这个镜像中添加其为环境变量
先进入docker交互界面,在docker内部搜一下这玩意儿
  1. sudo docker run -it --gpus all nvidia/cuda:10.0-base
  2. #查询系统中文件名开头为“libnvidia-ml”的文件路径
  3. find  -name libnvidia-ml*
Copy the Code
把它的路径添加到环境变量中
修改profile文件
  1. #打开文件
  2. vim /etc/profile
  3. #在末尾添加如下内容
  4. export PATH=$PATH:/usr/lib/x86_64-linux-gnu
  5. #然后让文件生效
  6. source /etc/profile
  7. #然后再测试nvidia驱动
  8. nvidia-smi
Copy the Code

配置成功
Reply View the author
avatar
不会开车有驾照
deepin
2020-05-12 06:42
#2
一看您这操作绝对不是小白,要是我早懵圈了
Reply View the author
avatar
ighack
deepin
2020-07-08 17:42
#3
修改/etc/nvidia-container-runtime/config.toml文件中的"@/sbin/ldconfig" 改为 "/sbin/ldconfig"
Reply View the author
avatar
滢泷迷雾
deepin
2020-09-08 23:07
#4
我直接在容器内安装了vim 然后这个症状就没了。
Reply View the author
avatar
滢泷迷雾
deepin
2020-09-08 23:08
#5
一头雾水,虽然找到办法了,但是不知道为啥。
Reply View the author