在英特尔独立显卡上训练ResNet PyTorch模型

文章作者：武卓，张晶

《在英特尔独立显卡上训练TensorFlow模型》介绍了在英特尔独立显卡上训练 TensorFlow 模型的全流程；本文将基于蝰蛇峡谷(Serpent Canyon) 详细介绍如何在英特尔独立显卡上训练 ResNet PyTorch 模型的全流程。

英特尔® 锐炫™ 独立显卡简介

英特尔® 锐炫™ 显卡基于 Xe-HPG 微架构，Xe HPG GPU 中的每个 Xe 内核都配置了一组 256 位矢量引擎，旨在加速传统图形和计算工作负载，以及新的 1024 位矩阵引擎或 Xe 矩阵扩展，旨在加速人工智能工作负载。

蝰蛇峡谷简介

蝰蛇峡谷(Serpent Canyon) 是一款性能强劲，并且体积小巧的高性能迷你主机，搭载全新一代混合架构的第 12 代智能英特尔® 酷睿™ 处理器，并且内置了英特尔® 锐炫™ A770M 独立显卡。

搭建训练 PyTorch 模型的开发环境

Windows 版本要求

在 Windows 上基于英特尔® 独立显卡训练 PyTorch 模型所依赖的软件包 torch-directml 要求：

Windows 10 的版本≥1709

Windows 11 的版本≥21H2

用“Windows logo 键+ R键”启动“运行”窗口，然后输入命令“winver”可以查得 Windows 版本。

下载并安装最新的英特尔显卡驱动

到英特尔官网下载并安装最新的英特尔显卡驱动。驱动下载链接：

https://www.intel.cn/content/www/cn/zh/download/726609/intel-arc-iris-xe-graphics-whql-windows.html

下载并安装Anaconda

下载并安装 Python 虚拟环境和软件包管理工具Anaconda：

https://www.anaconda.com/

安装完毕后，用下面的命令创建并激活虚拟环境pt_a770：

conda create --name pt_a770 python=3.9conda activate pt_a770

向右滑动查看完整代码

安装 PyTorch

在虚拟环境 pt_a770 中安装 PyTorch 1.13 。需要注意的是：torch-directml 软件包当前只支持 PyTorch 1.13。

pip install torch==1.13.0 torchvision==0.14.0 torchaudio==0.13.0

向右滑动查看完整代码

安装 torch-directml

在虚拟环境 pt_a770 中安装 torch-directml，这是一个在 Windows 平台上的机器学习训练加速软件包。

pip install torch-directml

向右滑动查看完整代码

安装其它支持软件包

在虚拟环境 pt_a770 中安装 opencv-python, numpy, pandas, tensorboard, matplotlib, tqdm, pyyaml, wget 和scipy，这些是辅助训练模型的软件包。

pip install opencv-python numpy pandas tensorboard matplotlib tqdm pyyaml wget scipy

向右滑动查看完整代码

到此，在 Windows 平台上用英特尔独立显卡训练 PyTorch 模型的开发环境配置完毕。