一种基于异构平台的卷积神经网络运算方法技术

技术编号：30345990 阅读：22 留言：0更新日期：2021-10-12 23:33

本发明专利技术公开了一种基于异构平台的卷积神经网络运算方法，采用CPU端和FPGA端组成异构平台，划分卷积神经网络的卷积层和全连接层，FPGA端设计运算阵列计算矩阵相乘，CPU端初始化FPGA端并重排数据，CPU端读取FPGA端的运算结果，将卷积神经网络运算转变为矩阵乘法运算，将规模较大的卷积或者全连接计算转换成多个小矩阵的循环迭代计算，只需根据当前层尺寸参数与矩阵参数设计，直接更改CPU代码，完成不同规模的卷积神经网络运算，相较传统的基于单一CPU或FPGA的开发方式，提升了效率与灵活性。提升了效率与灵活性。提升了效率与灵活性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于异构平台的卷积神经网络运算方法

[0001]本专利技术属于卷积神经网络
，具体涉及一种异构平台技术。

技术介绍

[0002]卷积神经网络是一种在图像处理有优势的前馈神经网络，随着硬件平台计算能力的不断提升，卷积神经网络在图像识别、目标检测和语音识别等方面取得了显著效果。伴随着硬件能力提升，卷积神经网络的复杂度也在不断提升，针对部分规模庞大的网络，巨大的运算量对开发实现提出了较大的挑战。
[0003]现阶段，相较传统的利用CPU处理器进行网络的推理，大多数卷积神经网络领域的研究者都会使用异构开发方式完成对网络的推理，使用异构开发方式能较大程度提高开发效率。OpenCL是一个在异构平台上编写程序的语言，异构平台可由CPU与GPU/DSP/FPGA硬件加速器组成，现阶段绝大多数成熟的异构开发平台都是采用CPU+GPU的组合。
[0004]FPGA作为一种可编程逻辑器件，其丰富的片上资源与开发的灵活性，展现出较大的优势。通过CPU+FPGA的组合，可充分利用FPGA作为可编程器件的在线重构特点，实现对不同类型与规模的卷积神经网络开发效率的提升。

技术实现思路

[0005]本专利技术为了解决现有技术存在的问题，提出了一种基于异构平台的卷积神经网络运算方法，针对不同网络类型、不同网络层存在的特征图尺寸、卷积核尺寸和神经元数量不同的特点，在只对CPU进行参数设置的情况下，完成FPGA对不同规模卷积神经网络的可重构加速计算，为了实现上述目的，本专利技术采用了以下技术方案。
[00...

【技术保护点】

【技术特征摘要】
1.一种基于异构平台的卷积神经网络运算方法，其特征在于，包括：采用CPU端和FPGA端组成异构平台，划分卷积神经网络的卷积层和全连接层，FPGA端设计运算阵列计算矩阵相乘，CPU端初始化FPGA端并重排初始图像和中间结果的数据，CPU端读取FPGA端的运算结果，将卷积神经网络运算转变为矩阵乘法运算。2.根据权利要求1所述的基于异构平台的卷积神经网络运算方法，其特征在于，所述采用CPU端和FPGA端组成异构平台，包括：在Linux环境以OpenCL规范，采用C++语言编译CPU端生成可执行文件、C语言编译FPGA端生成二进制比特流文件，CPU端通过PCIe总线将二进制比特流文件写入FPGA端，CPU端内存通过DMA模块读写FPGA端内存。3.根据权利要求1所述的基于异构平台的卷积神经网络运算方法，其特征在于，所述划分卷积神经网络的卷积层和全连接层，包括：将卷积神经网络划分为卷积层conv1至conv
X
、全连接层fc1至fc
Y
，定义每个卷积层的对应参数Para
conv1～X
，包括图像长H、图像宽W、通道数N、步长S、补零P、卷积核尺寸K、卷积核数M，定义每个全连接层的对应参数Para
fc1～Y
，包括单元数Q、神经元数R。4.根据权利要求1所述的基于异构平台的卷积神经网络运算方法，其特征在于，所述FPGA端设计运算阵列计算矩阵相乘，包括：运算阵列采用矩阵乘法核函数GEMM
‑
Kernel，输入两个矩阵数据，输出矩阵相乘的结果，定义静态参数BS1、BS2、BS3，单个GEMM
‑
Kernel单次读内存的矩阵运算大小为[BS1,BS2]
×
[BS2,BS3]，循环读取内存，完成两个矩阵相乘。5.根据权利要求4所述的基于异构平台的卷积神经网络运...

【专利技术属性】
技术研发人员：陈子洋，凌元，
申请(专利权)人：中国电子科技集团公司第十四研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人