一种基于FPGA的图神经网络高乘法器利用率的稀疏稠密矩阵乘法阵列制造技术

技术编号：34430135 阅读：24 留言：0更新日期：2022-08-06 16:06

本发明专利技术公开一种基于FPGA的图神经网络高乘法器利用率的稀疏稠密矩阵乘法阵列，其通过一套乘加法阵列结构，将图神经网络中组合运算中的稀疏稠密乘法拆分，能将源自不同节点，数量不定的有效值累加在一起，得到所需的稀疏稠密矩阵乘法结果。此方法平均每个周期有超过95％乘法器在进行有效运算，且无需复杂的数据预处理，拥有节点特征向量的利用率高，所需乘法器数量较少等优点。法器数量较少等优点。法器数量较少等优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于FPGA的图神经网络高乘法器利用率的稀疏稠密矩阵乘法阵列

[0001]本专利技术涉及机器学习
，更具体地，涉及一种基于FPGA的图神经网络高乘法器利用率的稀疏稠密矩阵乘法阵列。

技术介绍

[0002]以卷积神经网络(CNN)为代表的深度学习在广泛的应用场景中都有优异的表现，例如目标检测，视频处理，语音识别等等，但其只能从欧几里得数据中提取和分析潜在的信息。然而近年来，越来越多应用程序将关系复杂的对象建模为图这种非欧几里得的数据结构。
[0003]在图中，节点代表应用程序的对象，而边代表这些对象之间的关系。在某些应用场景中，图甚至拥有百万以上的节点数量。节点度，也就是与某个节点相关的边的数量，在一张图中变化很大，但通常遵循幂律分布。而且不同的图，每个节点拥有的特征特点也大不相同，这种不规则性使得卷积等操作无法很好的将目标特征提取出来。
[0004]图卷积网络(GNN)可以很好的处理这一类图数据，且已经在化学反应性预测，电子商务等诸多应用场景中取得了较好的成果，但其涉及的数据有高度不平衡的非零数据分部、较强的稀疏性和较大的矩阵尺度，这种数据特点使得GNN模型需要同时支持密集和极其稀疏的计算操作，需要适应计算特定GNN算法变量和图的结构，还需要能扩展到规模非常大的图。这使现有的深度卷积神经网络(DCNN)加速结构不能直接应用在GNN上。
[0005]每一层的GNN推理一共主要包含两个阶段：聚合和组合。聚合阶段中，每个节点将会聚合其邻居的特征向量来进行更新，由于节点之间的邻接矩阵极其稀疏...

【技术保护点】

【技术特征摘要】
1.一种基于FPGA的图神经网络高乘法器利用率的稀疏稠密矩阵乘法阵列，其特征在于，所述稀疏稠密矩阵乘法阵列用于能先组合后聚合的应用场景中，所述稀疏稠密矩阵乘法阵列包括预处理模块、特征缓存模块、乘法阵列和加法阵列，其中：所述预处理模块的输入为需要处理的GNN模型以及数据集，所述预处理模块根据所述GNN模型以及数据集生成所需的功能配置参数以及特征矩阵；所述特征缓存模块的输入为所述功能配置参数，所述特征缓存模块提供缓存并通过所述缓存将特征矩阵的有效值按一定顺序送入所述乘法阵列中；所述乘法阵列中进行乘法运算并将运算结果送入至所述加法阵列中，所述乘法阵列中还包括用于存储权重矩阵的存储器；所述加法阵列受功能配置参数的控制，对所述乘法阵列的运算结果进行合并整合，使得源自同一节点的部分和能累加在一起，最终得到后面聚合阶段所需的组合部分结果。2.根据权利要求1所述的基于FPGA的图神经网络高乘法器利用率的稀疏稠密矩阵乘法阵列，其特征在于，所述预处理模块根据GNN模型以及数据集生成所需的功能配置参数并送入所述特征缓存模块，再根据所述数据集和功能配置参数对特征矩阵和权重矩阵进行切片重排，对切片重排后的特征矩阵进行CSR编码后送入所述特征缓存模块中。3.根据权利要求2所述的基于FPGA的图神经网络高乘法器利用率的稀疏稠密矩阵乘法阵列，其特征在于，所述对特征矩阵进行切片重排，是根据每个节点拥有的有效值数量，从大到小根据贪婪算法遍历所有节点，将每个节点的有效值尽可能均匀分到不同的组中。4.根据权利要求3所述的基于FPGA的图神经网络高乘法器利用率的稀疏稠密矩阵乘法阵列，其特征在于，所述特征缓存模块包括特征缓存控制器、特征矩阵存储器、解码器和缓存器，其中，所述特征缓存控制器接收所述功能配置参数，并根据所述功能配置参数对所述特征矩阵存储器进行控制，所述特征矩阵存储器接收所述CSR编码后的特征矩阵，在所述特征缓存控制器下，往解码器中输送特征矩阵进行解码，解码后的特征矩阵数据进入缓存中，等待输送至所述乘法阵列。5.根据权利要求4所述的基于FPGA的图神经网络高乘法器利用率的稀疏稠密矩阵乘法阵列，其特征在于，令每个周期能处理的节点数量进行限制，假设每个周期只能处理n个顶点编号，对超...

【专利技术属性】
技术研发人员：黄以华，许翔智，
申请(专利权)人：中山大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人