深度学习环境搭建指南

本文将详细介绍如何在Ubuntu系统上搭建深度学习环境,包括NVIDIA显卡驱动、CUDA Toolkit和cuDNN的安装配置过程。

注:如果您使用的是Arch Linux系统,可以通过以下命令一键完成所有安装:

1
paru -S cudnn

1. NVIDIA显卡驱动安装

1.1 准备工作

首先使用 Ctrl + Alt + F1 进入字符终端界面,执行以下步骤:

  1. 删除已有的NVIDIA驱动:

    1
    2
    3
    sudo apt-get purge nvidia*
    sudo apt-get autoremove
    sudo ./NVIDIA-Linux-X86_64-384.59.run --uninstall
  2. 安装必要的依赖:

    1
    sudo apt-get install build-essential gcc-multilib dkms

1.2 禁用Nouveau驱动

  1. 编辑配置文件:

    1
    sudo nvim /etc/modprobe.d/blacklist-nouveau.conf
  2. 添加以下内容:

    1
    2
    3
    4
    5
    blacklist nouveau
    blacklist lbm-nouveau
    options nouveau modeset=0
    alias nouveau off
    alias lbm-nouveau off
  3. 执行以下命令禁用Nouveau:

    1
    2
    3
    echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf
    sudo update-initramfs -u
    sudo reboot

1.3 安装NVIDIA驱动

  1. 安装内核源码:

    1
    2
    sudo apt-get install linux-source
    sudo apt-get install linux-headers-$(uname -r)
  2. 关闭图形界面服务:

    1
    2
    3
    sudo systemctl stop lightdm  # 或 sudo service lightdm stop
    sudo systemctl stop gdm
    sudo systemctl stop kdm
  3. 下载并安装NVIDIA驱动:

  • NVIDIA官网下载对应版本的驱动
    1
    2
    sudo chmod +x NVIDIA*.run
    sudo ./NVIDIA-Linux-x86_64-384.59.run
  1. 验证安装:
    1
    nvidia-smi

2. CUDA Toolkit安装

  1. NVIDIA CUDA下载页面下载适合的CUDA版本

    注:Fedora版本也可用于Arch Linux

  2. 安装CUDA:

    1
    2
    chmod u+x cuda_<version>_linux.run
    sudo ./cuda_<version>_linux.run
  3. 验证安装:

    1
    nvcc -V

3. cuDNN安装

  1. cuDNN下载页面下载对应版本

  2. 安装cuDNN:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    # 复制头文件
    sudo cp include/* /usr/local/cuda/include/

    # 复制库文件
    sudo cp lib/* /usr/local/cuda/lib64/

    # 添加执行权限
    sudo chmod +x /usr/local/cuda/include/cudnn.h
    sudo chmod +x /usr/local/cuda/lib64/libcudnn*
  3. 验证安装:

    1
    cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

4. CUDA版本切换

如需切换CUDA版本,执行以下步骤:

1
2
3
4
5
6
7
8
9
10
11
# 进入目录
cd /usr/local

# 删除原CUDA符号链接
sudo rm -rf cuda

# 建立新的CUDA符号链接
sudo ln -s cuda-<version> cuda

# 验证版本
nvcc -V

参考资料