神经网络卷积权重layout优化的方法、装置、设备及可读介质制造方法及图纸

技术编号:31712758 阅读:24 留言:0更新日期:2022-01-01 11:16
本发明专利技术提供了一种神经网络卷积的权重layout优化的方法、装置、设备及可读介质,该方法包括:初始化累加器,由全局加载计算数据和权重数据到共享内存中后将计算数据加载到寄存器中;将权重数据中的输出通道的维度按照预设算法进行优化;使用优化后的权重进行矩阵乘计算;将在累加器中计算后的数据写入全局内存中。通过使用本发明专利技术的方案,能够使得数据在加载的时候做到全局内存的融合读写,又能避免累加器到全局内存时引入的共享内存数据读取过程,从而优化实际卷积计算时的流程,来达到神经网络卷积计算加速的效果。经网络卷积计算加速的效果。经网络卷积计算加速的效果。

【技术实现步骤摘要】
神经网络卷积权重layout优化的方法、装置、设备及可读介质


[0001]本专利技术涉及计算机领域,并且更具体地涉及一种神经网络卷积的权重layout优化的方法、装置、设备及可读介质。

技术介绍

[0002]随着互联网、大数据、云计算等技术的快速发展,人工智能(Artificial Intelligence,简称AI)发展突飞猛进,在语音识别、图像识别、智能控制、复杂计算等各大领域涌现出一系列应用产品,同时也在各行各业得到的广泛的应用,而图像处理一直是人工智能领域的研究热点,比如汽车自动驾驶,通过实时的路况图像信息采集以及处理,可以直接控制汽车在路上的行驶行为;在人脸识别方面,通过对比信息库中数据,可以对人脸图像的面部特征进行识别从而辨认身份,而这在社会安防方面已经发挥了重要的作用。
[0003]目前对人工智能图像识别与分类方面的研究主要有两方面,一方面是如何能够提高图像识别过程中的准确率,相关学者提出了各种卷积神经网络,比如Resnet50卷积神经网络模型,通过引入残差结构大大提高图像识别的精度;另一方面是如何提高图像识别过程的速度,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种神经网络卷积的权重layout优化的方法,其特征在于,包括以下步骤:初始化累加器,由全局加载计算数据和权重数据到共享内存中后将计算数据加载到寄存器中;将权重数据中的输出通道的维度按照预设算法进行优化;使用优化后的权重进行矩阵乘计算;将在累加器中计算后的数据写入全局内存中。2.根据权利要求1所述的方法,其特征在于,将权重数据中的输出通道的维度按照预设算法进行优化包括:获取权重数据中的输出通道K的值;将所述输出通道K的值以32为单位划分为若干大组,每个大组按顺序进行排列;将每个大组中的值以8为单位按顺序划分成4个小组,并对每个小组进行标号;将每个小组中以2为单位按顺序划分成4个数组,并对每个数组进行标号;将每个小组中标号相同的数组按小组标号的顺序放在一起形成新的4个小组;将得到的全部新的小组按顺序排列得到优化后的输出通道K。3.根据权利要求1所述的方法,其特征在于,所述权重数据包括输出通道K、卷积核尺寸中的长R、卷积核尺寸中的宽S和输入通道C。4.根据权利要求3所述的方法,其特征在于,所述输出通道K的值为32的整数倍。5.一种神经网络卷积的权重layout优化的装置,其特征在于,所述装置包括:加载模块,所述加载模块配置为初始化累加器,由全局加载计算数据和权重数据到共享内存中后将计算数据加载到寄存器中;优化模块,所述优化模块配置为将权重数据中的输出通道的维度按照预设...

【专利技术属性】
技术研发人员:王申领罗建刚
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1