[Exchange and share] deepinV23 双显卡部署 cuda
Tofloor
poster avatar
zzboat0422
deepin
2024-07-07 13:57
Author
目前在论坛里发现的安装cuda的教程,都是单独立显卡,且显示器插在独立显卡上。
我这边的环境是双显卡,且显示器插在核显上。本教程就是给大家看看在双显卡环境,显示器插在核显的时候,应该如何装cuda。
ubuntu环境可以直接apt安装,并且这也是nvidia 推荐的安装方式。
但是deepin 没法直接 apt 安装,只能够基于脚本进行编译安装。
安装文档参考论坛里以下几个帖子:
 
 
我总结一下,在双显卡环境下安装的区别。
一共分为七步:
 
第一步是下载源码安装包,可以参考https://bbs.deepin.org/post/271418
 
第二步是禁用开源的显卡驱动 nouveau:
# 切换root权限
sudo -i
 
# 确定是nvidia卡
update-pciids
lspci | grep -i nvidia
 
# 禁用 Nouveau 驱动程序
nano /etc/modprobe.d/blacklist-nouveau.conf
blacklist nouveau
options nouveau modeset=0
 
sudo update-initramfs -u
 
# 重启后验证,必需没有结果,才表示禁用成功。
reboot
lsmod | grep nouveau
 
第三步安装编译的依赖包。第三部分很重要,有的帖子没提,编译安装时会报错。
apt install g++ freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libglu1-mesa-dev libfreeimage-dev libglfw3-dev
 
第四步是必须在命令行界面,再停止图形界面后,再运行安装程序,如果在图形界面的终端运行,安装程序会报错。
按 ctrl+alt+f2 进入纯命令行界面,然后执行
sudo -i
systemctl stop lightdm.service
 
第五步运行安装命令,根据提示走,一般默认就行。注意,如果显示器插核显上,那么一定要加参数禁止安装 openGL 库,否则可能会让核显无输出,参见:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#installation
bash cuda_12.x.x_5xx.xx.xx_linux.run --no-opengl-files
 
第六步配置环境变量
# 配置环境变量
nano /etc/profile
export PATH=/usr/local/cuda-12.4/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.4/lib64/${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
 
最后一步是否设置持久化,这块大家根据自己的需求来配置,给一些链接给大家参考
 
 
安装完成后,会有一个小问题,即在明明没有用独显连显示器的情况下,nvidia-smi 命令仍然会显示有一个 /usr/lib/xorg/Xorg 进程在显卡上跑。如下图
xxx@xxxx:~$ nvidia-smi
Sun Jul  7 13:12:09 2024       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 555.42.02              Driver Version: 555.42.02      CUDA Version: 12.5     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 4070 ...    Off |   00000000:01:00.0  On |                  N/A |
|  0%   33C    P8              9W /  285W |     144MiB /  16376MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
                                                                                         
+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI        PID   Type   Process name                              GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|    0   N/A  N/A       955      G   /usr/lib/xorg/Xorg                              4MiB |
+-----------------------------------------------------------------------------------------+
 
此问题参考了以下很多资料,目前好像没有太好的办法:
 
这些资料总结下来大致是如下意思:
1、有这个进程的原因是因为 nvidia 的内核模块会先加载,xorg 进程在之后启动时会扫描已加载的显卡模块,然后启动一个对应的进程,哪怕这块显卡不用于图形显示。
2、只有使用 x11 的会产生这个进程,使用 wayland 的不会有此进程,因为 wayland 不依赖 xorg 进程。
3、如果在独显上插了 dp 线连显示器,此进程会占用133MB内存。
4、部分参考链接会说修改 /etc/X11/xorg.conf 或下面子目录的配置,deepin 无此配置文件,无法修改。
5、另一部分说移除 /usr/share/X11/xorg.conf.d/ 下的 nvidia 相关配置即可,实测此方法有效,但是有副作用:(1)显卡风扇自动启停功能几乎失效,风扇一直转;(2)nvidia-smi 命令变得很卡。
目前只能不管它。
 
Reply Favorite View the author
All Replies
fax928
deepin
2024-07-07 14:42
#1

感谢分享。

Reply View the author
晚秋(lateautumn)
Moderator
2024-07-07 15:31
#2

学习了。applaud

Reply View the author
qsd
deepin
2024-07-07 16:35
#3

like

Reply View the author
阿尼樱奈奈
Moderator
2024-07-07 16:36
#4
Reply View the author
jjcui8595
deepin
2024-07-07 18:02
#5

like

Reply View the author
乾豫恒益
deepin
2024-07-08 09:53
#6

收藏了。。。

like

Reply View the author
8***[email protected]
deepin
2024-09-04 11:34
#7

agree

谢谢分享

Reply View the author