跳过正文
NVIDIA【CUDA Toolkit】
  1. 运维日记/

NVIDIA【CUDA Toolkit】

·556 字·2 分钟·
目录
nvidia - 这篇文章属于一个选集。
§ 4: 本文

如何在NVIDIA GPU上进行性能压测,需要部署哪些工具?本文将介绍如何进行性能压测,以及需要部署哪些工具。

NVIDIA【CUDA Toolkit】
#

基础环境:

  • Ubuntu 22.04;内核5.15.0-119-generic
  • NVIDIA GPU
  • Mellanox

一、基础环境
#

1.1 配置源
#

  1. 备份原有 sources.list(若已存在则不重复覆盖)
[ -f /etc/apt/sources.list ] && cp -n /etc/apt/sources.list /etc/apt/sources.list.bak
  1. 写入阿里云 Ubuntu 22.04 (jammy) 镜像源
cat <<'EOF' > /etc/apt/sources.list
deb https://mirrors.aliyun.com/ubuntu/ jammy main restricted universe multiverse
deb-src https://mirrors.aliyun.com/ubuntu/ jammy main restricted universe multiverse

deb https://mirrors.aliyun.com/ubuntu/ jammy-security main restricted universe multiverse
deb-src https://mirrors.aliyun.com/ubuntu/ jammy-security main restricted universe multiverse

deb https://mirrors.aliyun.com/ubuntu/ jammy-updates main restricted universe multiverse
deb-src https://mirrors.aliyun.com/ubuntu/ jammy-updates main restricted universe multiverse

# deb https://mirrors.aliyun.com/ubuntu/ jammy-proposed main restricted universe multiverse
# deb-src https://mirrors.aliyun.com/ubuntu/ jammy-proposed main restricted universe multiverse

deb https://mirrors.aliyun.com/ubuntu/ jammy-backports main restricted universe multiverse
deb-src https://mirrors.aliyun.com/ubuntu/ jammy-backports main restricted universe multiverse
EOF
  1. 更新源
sudo apt update

1.2 内核包
#

apt install linux-image-5.15.0-119-generic linux-headers-5.15.0-119-generic linux-tools-5.15.0-119-generic linux-cloud-tools-5.15.0-119-generic

二、 CUDA Toolkit
#

如需安装指定版本,请访问CUDA Toolkit Archive

方式一: APT
#

  1. 安装
# 1. 下载repo
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
# 2. 安装
dpkg -i cuda-keyring_1.0-1_all.deb
# 3. 创建源列表
apt update
# 4. 安装;请注意后续其他包之间版本依赖问题
# 命令查看所有版本
apt-cache madison cuda-toolkit
apt install cuda-toolkit=12.8.0-1

方式二: 本地安装
#

  1. 根据平台选择对应的信息,此处离线提供 debrunfile 2种方式。

deb

  • 安装阶段不联网(依赖可能需要)
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-ubuntu2204-12-8-local_12.8.0-570.86.10-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2204-12-8-local_12.8.0-570.86.10-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-12-8-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-8

runfile

  • 可完全离线
  • 手动添加环境变量

runfile 更适合离线环境!如果没有安装 nvidia driver,可以使用 cuda 自带的 driver,保持默认选项即可。

wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda_12.8.0_570.86.10_linux.run
sudo sh cuda_12.8.0_570.86.10_linux.run
# 静默安装,并且不再勾选安装驱动
sudo sh cuda_12.8.0_570.86.10_linux.run --toolkit --no-drm --silent

环境变量

tee /etc/profile.d/cuda.sh >/dev/null <<'EOF'
# NVIDIA CUDA Toolkit environment

export CUDA_HOME=/usr/local/cuda
export PATH=$CUDA_HOME/bin:$PATH
export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH
EOF

chmod 644 /etc/profile.d/cuda.sh

立即生效

source /etc/profile.d/cuda.sh

结语
#

参考:

nvidia - 这篇文章属于一个选集。
§ 4: 本文

相关文章


微信赞赏
微信赞赏
关注公众号
关注公众号
支付宝赞赏
支付宝赞赏