【技术实现步骤摘要】
本专利技术涉及深度学习与高性能计算的交叉领域,特别是涉及一种基于多核处理器的三维卷积并行计算方法、装置和设备。
技术介绍
1、三维(three-dimensional)卷积是计算机视觉和深度学习领域的重要数据处理技术,并广泛地应用于处理三维数据的科学计算中,如三维模型分析、视频处理、医学成像、流体动力学、分子动力学等。
2、在卷积神经网络(cnn)中,三维卷积操作可以捕捉数据的空间和时间(或深度)维度的特征,进而提取更为丰富和复杂的信息,在结合高性能计算(hpc)和人工智能(ai)的应用中显得尤为关键。
3、新一代神威超级计算机搭载了最新的sw26010pro异构多核处理器,是我国最先进的超算平台之一,在国际高性能领域有着重要的战略意义。神威平台上部署了众多科学计算与人工智能的应用,而三维卷积作为其中的热点算子,是影响程序性能的关键因素,所以针对sw26010pro架构的三维卷积优化十分必要。
4、然而,尽管sw26010pro异构多核处理器具有十分强大的计算和存储能力,但是在其上的三维卷积性能远远不
...【技术保护点】
1.一种基于多核处理器的三维卷积并行计算方法,所述多核处理器的一个核组包含一个主核和一个具有多个从核的从核阵列,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述输入特征图和所述卷积核均具有通道维度参数,所述方法还包括:
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
4.根据权利要求1所述的方法,其特征在于,所述将结果写回主存,包括:
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,所述每一个所述从核负责一个所述计算单
...【技术特征摘要】
1.一种基于多核处理器的三维卷积并行计算方法,所述多核处理器的一个核组包含一个主核和一个具有多个从核的从核阵列,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述输入特征图和所述卷积核均具有通道维度参数,所述方法还包括:
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
4.根据权利要求1所述的方法,其特征在于,所述将结果写回主存,包括:
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,所述每一个...
【专利技术属性】
技术研发人员:李佳霖,冯志宸,田少博,叶煌,张鉴,
申请(专利权)人:中国科学院计算机网络信息中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。