最近拿到一台昇腾aarch64服务器,显卡为A100,十分可贵,可是与往常装备环境不同,服务器存在三大难题:
- 由于安全控制,服务器自身不能访问外网;
- 服务器自身为ARM架构(aarch64);
- 没有管理员权限,只拿到非Root用户;
本文将在以上条件的约束下,装置CUDA CUDNN magma-cuda,以便能够更好地运用这款强大的硬件设备。
一、装置CUDA和cudnn
1.1、下载CUDA驱动
1.首要查看体系的cuda驱动,能够看到这儿是12.3版别,所以咱们要下载比其低的CUDA,引荐11.8版别。

2.进入CUDA官网,依据体系版别挑选对应的runfile,注意由于是非root用户,不要用sudo的rpm装置,只能挑选下载runfile用sh装置,由于其他版别需求管理员权限才行,(假如不知道机器是什么版别,能够运用uname -m查看架构)

wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux_sbsa.run
假如没有外网环境用不了wget,运用本机下载这个.run文件后,然后传到服务器,运用sh装置。
1.2、装置CUDA驱动
假如是非root用户,终端cd进入下载好.run文件的目录,运用sh装置:sh cuda_11.8.0_520.61.05_linux_sbsa.run
首要会弹出问你接不接受一个协议,输入accept:






做完Done,回到Options菜单, 更改Library install path (不改不可,它会悄悄写入/var/lib)




1.3、装备环境变量
装置好后还不能运用nvcc –V,需求装备环境变量:
输入 vim ~/.bashrc
进入环境变量,进行更改:
# CUDA
export PATH="/刚刚的途径/cuda-10.1/bin:$PATH"
export LD_LIBRARY_PATH="/刚刚的途径/cuda-11.8/lib64:/刚刚的途径/cuda-11.8/mylib/lib64:$LD_LIBRARY_PATH"
途径要记住换成自己的:

source ~/.profile
最后测验CUDA,输入nvcc -V
,假如显现了版别号,则恭喜大获成功:

1.4、装置cudnn
这儿参考了:blog.csdn.net/YY007H/arti…
1.5、装置magma-cuda
magma-cuda首要用于大规模线性代数计算和GPU加速。
首要进入anaconda官方网站:anaconda.org/search?q=ma…

conda install --use-local 包名.tar.bz2
等待顷刻,装置完成后输入conda list就能够看到包名了,假如看不到包名的话大概率是包名的问题,比如linux-64_magma-cuda118-2.6.1-1.tar.bz2要改成magma-cuda118-2.6.1-1.tar.bz2。
最后输入:conda list验证是否成功装置magma-cuda