深度学习是一项尖端技术,它使机器能够自行学习和改进。然而,在 Ubuntu 22.04 系统上设置深度学习环境对于那些刚接触这项技术的人来说可能是一项艰巨的任务。
在本文中,我们将带您完成在 Ubuntu 22.04 上设置深度学习架构的过程,包括 Nvidia 驱动程序、Cuda、cuDNN、Anaconda 设置等关键配置,以确保安装成功。
系统要求
此设置已在具有以下配置的 Google Cloud Compute Engine 上配置的虚拟机上进行了测试。
- GPU:特斯拉 T4
- CPU:N1-Standard2(2vCPU 7.5GB 内存)
- 操作系统:Ubuntu 22.04 (x86/64)
- 磁盘空间:50 GB
- 安全启动:禁用。
这台机器在 US-Central 的成本大约为 250 美元/月。
更新系统
在开始安装过程之前,建议使用最新的补丁和软件更新来更新系统。运行以下命令更新您的 Ubuntu 22.04 系统:
sudo apt update
sudo apt upgrade
验证显卡
使用以下命令验证您是否有 GPU。
lspci | grep -i nvidia
如果您有 GPU,则可以继续进行以下安装。
Output
00:04.0 3D Controller: NVIDIA Corporation TU104GL [Tesla T4] (rev a1)
在本指南中,我使用的是 Nvidia Tesla T4 GPU。
安装预先需要的包
在安装 Nvidia 驱动程序之前,您需要确保已安装所有预先需要的软件包。
sudo apt install build-essential
安装内核头文件
您可以使用以下命令为您的操作系统安装内核头文件。
sudo apt install linux-headers-$(uname -r)
现在您可以继续安装驱动程序
安装 NVIDIA 驱动程序
在 Ubuntu 22.04 上设置深度学习的最重要步骤之一是为您的显卡安装合适的 NVIDIA 驱动程序。为此,请打开终端并运行以下命令:
sudo apt install nvidia-driver-530
现在您需要重新启动。
sudo reboot
安装 CUDA 工具包和 cuDNN
接下来,您需要安装 CUDA 工具包和 cuDNN,它们对于运行 TensorFlow 和 PyTorch 等深度学习框架至关重要。您可以从 NVIDIA 网站下载最新版本的 CUDA 工具包,并从 cuDNN 网站下载 cuDNN。下载适当的文件后,您可以通过运行以下命令来安装它们:
安装CUDA
wget https://developer.download.nvidia.com/compute/cuda/12.1.1/local_installers/cuda_12.1.1_530.30.02_linux.run
sudo sh cuda_12.1.1_530.30.02_linux.run
按照屏幕上的说明进行操作。
- 通过键入accept接受许可协议
- 取消选择驱动程序,然后使用箭头键和空格键移动并选择或取消选择安装。你不应该
X
在驱动程序中有标记 - 将箭头键向下移动到Install并单击Enter。
等待一段时间让安装完成。
现在 CUDA 将安装到位/usr/local/cuda-12.1
。
符号链接目录。
sudo ln -snf /usr/local/cuda-12.1 /usr/local/cuda
安装 CUDNN
要安装 cuDNN,您需要登录 Nvidia 网站并使用此官方链接下载 tar.gz 版本。
下载后解压缩下载的文件并将必要的内容复制到cuda
目录中。
tar -zvxf cudnn-linux-x86_64-8.9.0.131_cuda12-archive.tar.xz
cd cudnn-linux-x86_64-8.9.0.131_cuda12-archive
sudo cp include/cudnn.h /usr/local/cuda-12.1/include
sudo cp lib/libcudnn* /usr/local/cuda-12.1/lib64
sudo chmod a+r /usr/local/cuda-12.1/include/cudnn.h /usr/local/cuda-12.1/lib64/libcudnn*
现在您已经安装了 CUDA 和 CUDNN。
安装完成后,更新环境变量,并添加以下行 ~/.bashrc
export CUDA_HOME=/usr/local/cuda-12.1
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
export PATH=${CUDA_HOME}/bin:${PATH}
激活环境变量:
source ~/.bashrc
您可以使用以下命令检查 cuda 版本。
nvcc -V
您还可以使用以下命令检查 Nvidia 驱动程序安装状态。
nvidia-smi
您将获得类似于下图的输出。
安装Anaconda
Anaconda 是一种流行的 Python 发行版,带有许多用于深度学习的预安装库和工具。要安装 Anaconda,请运行以下命令:
您可以使用anaconda 官方网站上的最新版本更新以下链接。
curl https://repo.anaconda.com/archive/Anaconda3-2023.03-1-Linux-x86_64.sh --output anaconda.sh
bash anaconda.sh
按照屏幕上的说明进行操作。
在最后一步中,您可以安全地回答Yes
初始化 Anaconda3。
创建新的 Conda 环境
Conda 环境是一个虚拟环境,允许您安装和管理不同版本的包和库。要创建新的 Conda 环境,请运行以下命令:
conda create --name deep-learning
激活 Conda 环境
创建新的 Conda 环境后,您需要通过运行以下命令来激活它:
conda activate deep-learning
安装深度学习框架
现在您已经安装了必要的驱动程序和工具,您可以安装您选择的深度学习框架,例如 TensorFlow 或 PyTorch。您可以使用 Python 包管理器 pip 安装这些框架,如下所示:
pip3 install tensorflow
pip3 install keras
pip install torch
验证您的安装
要测试安装,您可以运行使用 TensorFlow、Keras 和 PyTorch 的示例脚本。创建一个新的 Python 文件并粘贴以下代码:
sudo nano learning.py
粘贴以下代码并保存文件。
import tensorflow as tf
import keras
import torch
print("TensorFlow version:", tf.version)
print("Keras version:", keras.version)
print("PyTorch version:", torch.version)
使用以下命令执行该文件:
python learning.py
如果一切安装正确,您应该会在屏幕上看到 TensorFlow、Keras 和 PyTorch 的版本。
包起来!
总之,在 Ubuntu 22.04 中设置深度学习环境可能是一项具有挑战性的任务,但按照上述步骤,您可以确保顺利成功安装。通过安装必要的驱动程序和工具,然后安装您喜欢的深度学习框架,您将可以顺利地开发和运行您自己的深度学习模型。
原创文章,作者:网贝WebBay,如若转载,请注明出处:https://www.webbay.cn/how-to-set-up-deep-learning-with-nvidia-cuda-cudnn-on-ubuntu-22-04