Ubuntu配置GPU支持TensorFlow和PyTorch教程

电脑刚刚重做了系统,环境干净的一批,简单记录一下,如果哪里不对,请留言,我会予以修正。

参考:

Ubuntu21.10下安装TensorFlow及配置GPU支持(cuda11.1+cudnn8.1.0)
Linux查看当前Cuda(CUDA Toolkit )版本
Ubuntu22.04安装CUDA、cudnn详细步骤

Target:

Nvidia driver(545.29.02), CUDA(12.3/12.4), Tensorflow-gpu, cuDNN

步骤

安装Nvidia driver

  1. 添加PPA源
sudo add-apt-repository ppa:graphics-drivers/ppa

为系统安装依赖项以构建内核模块:

sudo apt-get install dkms build-essential
  1. 查看显卡硬件型号
ubuntu-drivers devices

输出如下:


GPU

可以看到推荐安装的驱动版本号为:


select driver
  1. 安装NVIDIA驱动
sudo ubuntu-drivers autoinstall

系统会自动安装推荐版本驱动,接着重启系统。重启时间会比以往慢一点,开机时会显示NVRM: loading NVIDIA UNIX Open Kernel Module for...
等着就可以了。

安装CUDA

  1. 检测所需CUDA版本:
nvidia-smi

显示如下,右上角的CUDA version 就是与此驱动相匹配的Cuda版本 12.3,一般来说可以安装12.3或者更低一点的版本,此教程中安装12.3版本,如果下面出现12.4版本是第二次修改后结果,使用者统一就好:


coda
  1. 下载相关依赖
sudo apt-get install freeglut3 freeglut3-dev libxi-dev libxmu-dev

大概需要个1分钟吧

  1. 下载安装文件
    下载网址:https://developer.nvidia.com/cuda-downloads
    按照自身系统选择后会出现安装命令,此教程选择runfile,需要保持网络连接,
    cuda_run

    运行命令的第一行:
wget https://developer.download.nvidia.com/compute/cuda/12.3.0/local_installers/cuda_12.3.0_545.23.06_linux.run

结果如下图所示:


cuda_run_install
  1. 安装cuda-toolkit
sudo sh ./cuda_12.3.0_545.23.06_linux.run --toolkit --silent --override

运行时间可能有点长,耐心等待一下

  1. 配置环境变量
    (非必要) 由于没有vim,先安装vim:
sudo apt install vim

打开bashrc文件, sudo 可避免保存时出现E212:无法打开并写入文件 的错误提示

sudo vim ~/.bashrc

输入i进入输入模式添加如下内容,添加好后按‘Esc’退出输入模式,':wq':保存文件并退出 Vim 编辑器。

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda

使修改生效:

source ~/.bashrc
  1. 检验安装
nvcc --version

获得输出如下


cuda_final

安装Tensorflow-gpu

  1. 创建新的虚拟环境env
conda create -n env python=3.9

进入此虚拟环境

conda activate env

如果想使用下一步简便的指令,需要Python 3.6–3.9

  1. 安装tensorflow-gpu
pip install tensorflow[and-cuda]
tensorflow-gpu
  1. 进入python环境进行测试
python
>>> import tensorflow as tf
>>> print(tf.__version__)
>>> tf.test.is_built_with_cuda()
>>> print(tf.config.list_physical_devices('GPU'))
tfTest

安装pytorch

  1. 进入官网 https://pytorch.org/get-started/locally/
    如果cuda版本低一点就按照他这个来
    image.png

    如果cuda版本是12.4,目前不支持直接用命令安装,进入建议的Github: https://github.com/pytorch/pytorch#from-source,只有一丢丢麻烦
    image.png
  2. 通过source安装


    image.png

    (1) 两个需求:1是python版本,在创建虚拟环境的时候已经确定为3.9,满足要求;2是确定gcc版本,我不确定正常来说有没有gcc,但我这个新的虚拟环境中是可以找到的,如果没有安装一个就好了

gcc --version
gcc

(2)安装依赖
安装 Intel 的数学核心库(MKL)和MAGMA 库

  • Intel MKL (Math Kernel Library):这是一个高度优化的数学库,专为加速数学运算而设计,尤其是在 Intel 架构的处理器上。它提供了高性能的线性代数运算、快速傅里叶变换、矢量数学以及统计功能。这些库优化了多种数学操作,特别是在 CPU 上运行的密集型数学计算,从而提高了 PyTorch 在 CPU 上的性能。
  • MAGMA(Matrix Algebra on GPU and Multicore Architectures):这是一个数学库,旨在利用 GPU 进行密集的线性代数运算,如矩阵分解、求解线性方程组等。MAGMA 是为了优化这类计算在多核心架构和 GPU 上的执行而设计的。对于在 GPU 上使用 PyTorch 进行深度学习训练,尤其是涉及到复杂的线性代数运算(如在训练过程中使用到的大规模矩阵操作)时,MAGMA 可以提供显著的性能提升。magma-cuda124:这个包特别为 CUDA 12.4 版本编译的 MAGMA 库版本。
conda install intel::mkl-static intel::mkl-include
# CUDA only: Add LAPACK support for the GPU if needed
conda install -c pytorch magma-cuda124  # or the magma-cuda* that matches your CUDA version from https://anaconda.org/pytorch/repo

(3)下载pytorch资源

git clone --recursive https://github.com/pytorch/pytorch
cd pytorch

下载会有点慢。。。别急
(4)安装pytorch

QR Code
微信扫一扫,欢迎咨询~

联系我们
武汉格发信息技术有限公司
湖北省武汉市经开区科技园西路6号103孵化器
电话:155-2731-8020 座机:027-59821821
邮件:tanzw@gofarlic.com
Copyright © 2023 Gofarsoft Co.,Ltd. 保留所有权利
遇到许可问题?该如何解决!?
评估许可证实际采购量? 
不清楚软件许可证使用数据? 
收到软件厂商律师函!?  
想要少购买点许可证,节省费用? 
收到软件厂商侵权通告!?  
有正版license,但许可证不够用,需要新购? 
联系方式 155-2731-8020
预留信息,一起解决您的问题
* 姓名:
* 手机:

* 公司名称:

姓名不为空

手机不正确

公司不为空