一种基于多核处理器的三维卷积并行计算方法、装置和设备制造方法及图纸

技术编号:41903746 阅读:22 留言:0更新日期:2024-07-05 14:09
本发明专利技术涉及深度学习与高性能计算的交叉领域,特别是涉及一种基于多核处理器的三维卷积并行计算方法、装置和设备。该方法包括:根据多核处理器的从核阵列的存储器可用空间尺寸,将输入特征图在平行于其第三维度的方向上,分割为多个子输入特征图;获取卷积核,从子输入特征图中取与卷积核包含的卷积核平面矩阵数量相等的子输入特征图平面矩阵,与卷积核一并送入从核阵列,做三维矩阵卷积计算;将三维矩阵卷积计算对应于从核阵列中可用从核数量划分为数量相当的若干计算单元,每一个从核负责一个计算单元的计算,在计算单元的计算过程中,数据交换在从核阵列的存储器内进行,从核之间并行计算,在所有从核均计算完毕后,再将结果写回主存。

【技术实现步骤摘要】

本专利技术涉及深度学习与高性能计算的交叉领域,特别是涉及一种基于多核处理器的三维卷积并行计算方法、装置和设备


技术介绍

1、三维(three-dimensional)卷积是计算机视觉和深度学习领域的重要数据处理技术,并广泛地应用于处理三维数据的科学计算中,如三维模型分析、视频处理、医学成像、流体动力学、分子动力学等。

2、在卷积神经网络(cnn)中,三维卷积操作可以捕捉数据的空间和时间(或深度)维度的特征,进而提取更为丰富和复杂的信息,在结合高性能计算(hpc)和人工智能(ai)的应用中显得尤为关键。

3、新一代神威超级计算机搭载了最新的sw26010pro异构多核处理器,是我国最先进的超算平台之一,在国际高性能领域有着重要的战略意义。神威平台上部署了众多科学计算与人工智能的应用,而三维卷积作为其中的热点算子,是影响程序性能的关键因素,所以针对sw26010pro架构的三维卷积优化十分必要。

4、然而,尽管sw26010pro异构多核处理器具有十分强大的计算和存储能力,但是在其上的三维卷积性能远远不能令人满意,目前sw本文档来自技高网...

【技术保护点】

1.一种基于多核处理器的三维卷积并行计算方法,所述多核处理器的一个核组包含一个主核和一个具有多个从核的从核阵列,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述输入特征图和所述卷积核均具有通道维度参数,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述将结果写回主存,包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述每一个所述从核负责一个所述计算单元的计算,包括:...

【技术特征摘要】

1.一种基于多核处理器的三维卷积并行计算方法,所述多核处理器的一个核组包含一个主核和一个具有多个从核的从核阵列,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述输入特征图和所述卷积核均具有通道维度参数,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述将结果写回主存,包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述每一个...

【专利技术属性】
技术研发人员:李佳霖冯志宸田少博叶煌张鉴
申请(专利权)人:中国科学院计算机网络信息中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1