Pytorch1.7多卡环境配置安装教程

1 加载module环境

module rm compiler/rocm/2.9
module load compiler/rocm/3.9.1
module load apps/PyTorch/1.7-dynamic/hpcx-2.4.1-gcc-7.3.1-rocm3.9

2 程序报错内容

(1) 环境加载完成,运行主程序,报错如下:

描述

(2) 根据错误提示,在MIOPEN官网找到解决方式, 添加如下指令:

export MIOPEN_DEBUG_DISABLE_FIND_DB=1

描述

3 删除相关文件、添加环境变量

在home下ls -a找到隐藏文件夹.cache和.config,进入文件夹中删除MIOPEN文件 添加环境变量至bashrc 或slurm脚本中。

export MIOPEN_DEBUG_DISABLE_FIND_DB=1
export MIOPEN_DEBUG_CONV_WINOGRAD=0 
export MIOPEN_DEBUG_CONV_IMPLICIT_GEMM=0

配置完毕。

results matching ""

    No results matching ""