Pytorch1.7多卡环境配置安装教程
1 加载module环境
module rm compiler/rocm/2.9
module load compiler/rocm/3.9.1
module load apps/PyTorch/1.7-dynamic/hpcx-2.4.1-gcc-7.3.1-rocm3.9
2 程序报错内容
(1) 环境加载完成,运行主程序,报错如下:
(2) 根据错误提示,在MIOPEN官网找到解决方式, 添加如下指令:
export MIOPEN_DEBUG_DISABLE_FIND_DB=1
3 删除相关文件、添加环境变量
在home下ls -a找到隐藏文件夹.cache和.config,进入文件夹中删除MIOPEN文件 添加环境变量至bashrc 或slurm脚本中。
export MIOPEN_DEBUG_DISABLE_FIND_DB=1
export MIOPEN_DEBUG_CONV_WINOGRAD=0
export MIOPEN_DEBUG_CONV_IMPLICIT_GEMM=0
配置完毕。