一种基于FPGA的图卷积神经网络的流水线结构制造技术

技术编号：37203060 阅读：10 留言：0更新日期：2023-04-20 22:57

本发明专利技术公开了一种基于FPGA的图卷积神经网络的流水线结构。其用一个流水线形式的缓存来链接结合模块和聚合模块，同时每一层图卷积神经网络先进行结合模块的计算，然后将其结果送入中间的流水线中，再进入聚合模块。所述各个模块的输入和输出都是矩阵的形式，结合模块一列一列地依次输出，一次输出一列的数据进入流水线，再将这一列的数据进入聚合模块，以使得聚合模块直接计算矩阵和一列数据的乘法，也就是矩阵和向量的乘法。本发明专利技术的结构中结合模块以及聚合模块内部能够并行计算，并且这两个模块之间使用流水线的方式相连，能减少整个神经网络的推理过程的延迟。经网络的推理过程的延迟。经网络的推理过程的延迟。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于FPGA的图卷积神经网络的流水线结构

[0001]本专利技术属于FGPA
，具体的说，涉及一种基于FPGA的图卷积神经网络的结合、聚合模块的流水线结构。

技术介绍

[0002]图卷积神经网络(Graph Convolutional Network, GCN)是一种针对图结构（Graph）的数据的特征提取器。图结构数据包含三个基本元素，结点、结点之间的连线、每个结点的特征向量。GCN通过对每个结点的全部邻点提取特征向量，进行线性计算，从而提取出整个图的特征。GCN的计算过程比较简单，可以分为结合（Combination）和聚合（Aggregation）两个步骤，总共包括了稀疏矩阵乘法、密集矩阵乘法以及激活函数Relu三种计算。其中，结合的步骤包含了密集矩阵的乘法，聚合的步骤包含了稀疏矩阵的乘法，不同的GCN层之间则通过Relu激活函数连接起来。
[0003]现场可编程门阵列（Field Programmable Gate Array,FPGA）有着低功耗、低成本、高可重构性、高稳定性等特点，现在有着广阔的发展前景。此外，FPGA有着很大的并行度。FPGA中的硬件资源统一受时钟信号的控制，不同的计算单元可以相互之间独立运行，对于并行的程序有着很强的加速能力。我们可以通过FPGA，来对GCN的推理过程进行加速。
[0004]GCN的主要计算难点，在于矩阵的数据量非常庞大，并且还包含了稀疏矩阵的乘法计算，使得GCN的推理过程变得难以优化。普通矩阵乘法以及稀疏矩阵乘法的串行，是GCN的一个显著的特...

【技术保护点】

【技术特征摘要】
1.一种基于FPGA的图卷积神经网络的流水线结构，其特征在于，其部署在FPGA上，用于对图卷积神经网络中的数据流进行优化，使结合模块和聚合模块之间的数据形成流水线，从而降低延迟，加速图卷积神经网络的推理过程；其包括结合模块、流水线形式的缓存和聚合模块；所述各个模块的输入和输出都是矩阵的形式，结合模块一列一列地依次输出，一次输出一列的数据进入缓存储存，缓存再将这一列的数据按照流水线形式进入聚合模块，以使得聚合模块直接计算稀疏矩阵和缓存中一列数据的乘法，也就是矩阵和向量的乘法，实现稀疏矩阵的乘法运算。2.根据权利要求1所述的流水线结构，其特征在于，结合模块采用多个计算单元并行的方式实现密集矩阵的乘法运算。3.根据权利要求2所述的流水线结构，其特征在于，结合模块中，...

【专利技术属性】
技术研发人员：叶景格，王堃，
申请(专利权)人：复旦大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人