卷积神经网络模型的优化方法、装置、设备及存储介质制造方法及图纸

技术编号:39328442 阅读:11 留言:0更新日期:2023-11-12 16:05
本申请提供一种卷积神经网络模型的优化方法、装置、设备及存储介质,涉及卷积神经网络算法部署技术领域。该方法包括:获取待优化的卷积神经网络模型,待优化的卷积神经网络模型包括第一卷积层;根据第一卷积层对应的通道的初始权重,确定第一卷积层的参考权重,并将参考权重写入第一卷积层对应的每个通道中;根据参考权重、以及第一卷积层对应的每个通道的初始权重,确定第一卷积层对应的每个通道的缩放系数;根据第一卷积层对应的每个通道的缩放系数,在第一卷积层之后增加第一缩放层,得到优化后的卷积神经网络模型。该方法适用于卷积神经网络模型的部署过程中,用于优化卷积神经网络模型。络模型。络模型。

【技术实现步骤摘要】
卷积神经网络模型的优化方法、装置、设备及存储介质
[0001]本申请要求于2022年4月22日提交国家知识产权局、申请号为202210429683.7、申请名称为“卷积神经网络模型的优化方法、装置、设备及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。


[0002]本申请涉及卷积神经网络算法部署
,尤其涉及一种卷积神经网络模型的优化方法、装置、设备及存储介质。

技术介绍

[0003]卷积神经网络(convolut ional neural network,CNN)是是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一,被广泛应用于图像处理等领域。包含卷积神经网络的卷积神经网络模型在完成训练之后拥有的参数较多。例如,卷积神经网络模型中的各层的几百甚至上千万的权重、以及偏置参数等。并且在卷积神经网络模型的计算过程中,利用较多的参数计算出的中间结果也较多。拥有较多的参数、以及中间结果的卷积神经网络模型在实际部署到平台上时,对于平台的存储空间、以及计算能力等的要求较高,平台可能无法满足卷积神经网络模型的部署要求。
[0004]为了降低卷积神经网络模型的部署要求,需要对卷积神经网络模型计算的数据进行压缩,这种压缩的方法可以称作量化。量化可以包括per

tensor量化和per

channel量化。per

tensor对卷积神经网络的性能影响较大。per

channel量化的适用性较差。<br/>
技术实现思路

[0005]本申请提供一种卷积神经网络模型的优化方法、装置、设备及存储介质,可以对卷积神经网络模型进行优化,减少卷积神经网络模型中的参数、以及计算的中间结果,并且计算简单,不受平台的限制,适用性较强。
[0006]第一方面,本申请提供一种卷积神经网络模型的优化方法,该方法包括:获取待优化的卷积神经网络模型,待优化的卷积神经网络模型包括第一卷积层;根据第一卷积层对应的通道的初始权重,确定第一卷积层的参考权重,并将参考权重写入第一卷积层对应的每个通道中;参考权重用于代表第一卷积层的每个通道的初始权重;根据参考权重、以及第一卷积层对应的每个通道的初始权重,确定第一卷积层对应的每个通道的缩放系数;根据第一卷积层对应的每个通道的缩放系数,在第一卷积层之后增加第一缩放层,得到优化后的卷积神经网络模型;第一缩放层用于还原写入参考权重的第一卷积层的卷积计算结果。
[0007]本申请提供的卷积神经网络模型的优化方法,可以获取待优化的初始卷积神经网络模型,初始卷积神经网络模型可以包括第一卷积层。根据第一卷积层对应的通道的初始权重,确定第一卷积层的参考权重,并将参考权重写入第一卷积层对应的每个通道中,第一卷积层对应的每个通道的权重均为参考权重,减少了卷积神经网络模型中的参数的数量、以及计算出的中间结果的数量,达到了对初始卷积神经网络模型进行量化的效果,从而优
化了初始卷积神经网络模型。然后,根据参考权重、以及第一卷积层对应的每个通道的初始权重,确定第一卷积层对应的每个通道的缩放系数,根据第一卷积层对应的每个通道的缩放系数,在第一卷积层之后增加第一缩放层,在优化之后还可以对卷积计算的结果进行部分还原,减小了优化的粒度,降低了对卷积神经网络模型的性能的影响。
[0008]此外,本申请提供的卷积神经网络模型的优化方法计算简单,不受平台的限制,适用性较强。
[0009]一种可能的实现方式中,第一卷积层对应的通道包括多个;根据第一卷积层对应的通道的初始权重,确定第一卷积层的参考权重,包括:确定第一卷积层对应的每个通道的最大初始权重,得到多个通道分别对应的最大初始权重;从多个通道分别对应的最大初始权重中确定参考权重。
[0010]另一种可能的实现方式中,第一卷积层对应的通道包括多个;根据第一卷积层对应的通道的初始权重,确定第一卷积层的参考权重,包括:获取训练输入样本;将训练输入样本输入待优化的卷积神经网络模型,得到待优化的卷积神经网络模型的第一输出结果;将每个初始权重写入第一卷积层对应的每个通道,并将训练输入样本输入写入初始权重后的待优化的卷积神经网络模型,得到写入初始权重后的待优化的卷积神经网络模型的第二输出结果;第二输出结果与初始权重一一对应;根据第一输出结果、以及每个初始权重对应的第二输出结果,从初始权重中确定参考权重。
[0011]又一种可能的实现方式中,根据第一输出结果、以及每个初始权重对应的第二输出结果,从初始权重中确定参考权重,包括:从第二输出结果中确定与第一输出结果的相似度最高的目标输出结果;将目标输出结果对应的初始权重确定为参考权重。
[0012]本申请提供的卷积神经网络模型的优化方法,将每个初始权重作为候选参考权重写入第一卷积层对应的每个通道中进行训练,可以得到输出结果与待优化的卷积神经网络模型的输出结果相似度最高的初始权重(候选参考权重)作为第一卷积层的参考权重。也即,利用训练的方式从初始权重中选择参考权重,优化前后的卷积神经网络模型输出的结果相似度最高,进一步降低了对卷积神经网络模型的性能的影响。
[0013]又一种可能的实现方式中,第一卷积层对应的通道的初始权重的数量大于第一阈值。
[0014]又一种可能的实现方式中,所述优化的卷积神经网络用于对图像、音频、文字和/或视频进行处理。
[0015]又一种可能的实现方式中,该方法还包括:统计待优化的卷积神经网络模型中的每一个卷积层分别对应的通道的初始权重;对待优化的卷积神经网络模型中的每一个卷积层,当卷积层对应的通道的初始权重的数量大于第一阈值时,将卷积层确定为第一卷积层。
[0016]本申请提供的卷积神经网络模型的优化方法,还可以根据卷积层中的初始权重的数量,有选择地对待优化的卷积神经网络模型中的卷积层进行优化,优化更加灵活。
[0017]又一种可能的实现方式中,第一卷积层的数量为多个。
[0018]第二方面,本申请提供一种卷积神经网络模型的优化装置,该卷积神经网络模型的优化装置包括用于之上第一方面或第一方面中任一种可能的实现方式所述的方法的各个模块。
[0019]第三方面,本申请提供一种计算机程序产品,当该计算机程序产品在计算机上运
行时,使得计算机执行上述第一方面所述相关方法的步骤,以实现上述第一方面所述的方法。
[0020]第四方面,本申请提供一种电子设备,该电子设备包括:处理器和存储器;存储器存储有处理器可执行的指令;处理器被配置为执行指令时,使得电子设备实现上述第一方面所述的方法。
[0021]第五方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质包括:计算机软件指令;当计算机软件指令在电子设备中运行时,使得电子设备实现上述第一方面所述的方法。
[0022]上述第二方面至第五方面的有益效果可以参考第一方面所述,不再赘述。
附图说明
[0023]图1为本申请实施例提供的优化系统的组成示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种卷积神经网络模型的优化方法,其特征在于,所述方法包括:获取待优化的卷积神经网络模型,所述待优化的卷积神经网络模型包括第一卷积层;根据第一卷积层对应的通道的初始权重,确定所述第一卷积层的参考权重,并将所述参考权重写入所述第一卷积层对应的每个通道中;所述参考权重用于代表所述第一卷积层的每个通道的初始权重;根据所述参考权重、以及所述第一卷积层对应的每个通道的初始权重,确定所述第一卷积层对应的每个通道的缩放系数;根据所述第一卷积层对应的每个通道的缩放系数,在所述第一卷积层之后增加第一缩放层,得到优化后的卷积神经网络模型;所述第一缩放层用于还原写入所述参考权重的所述第一卷积层的卷积计算结果。2.根据权利要求1所述的方法,其特征在于,所述第一卷积层对应的通道包括多个;所述根据第一卷积层对应的通道的初始权重,确定所述第一卷积层的参考权重,包括:确定所述第一卷积层对应的每个通道的最大初始权重,得到多个所述通道分别对应的最大初始权重;从所述多个所述通道分别对应的最大初始权重中确定所述参考权重。3.根据权利要求1所述的方法,其特征在于,所述第一卷积层对应的通道包括多个;所述根据第一卷积层对应的通道的初始权重,确定所述第一卷积层的参考权重,包括:获取训练输入样本;将所述训练输入样本输入所述待优化的卷积神经网络模型,得到所述待优化的卷积神经网络模型的第一输出结果;将每个所述初始权重写入所述第一卷积层对应的每个通道,并将所述训练输入样本输入写入所述初始权重后的所述待优化的卷积神经网络模型,得到写入所述初始权重后的所述待优化的卷积神经网络模型的第二输出结果;所述第二输出结果与所述初始权重一一对应;根据所述第一输出结果、以及每个所述初始权重对应的所述第二输出结果,从所述初始权重中确定所述参考权重。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一输出结果、以及每个所述初始权重对应的所述第二输出结果,从所述初始权重中确...

【专利技术属性】
技术研发人员:何映材叶挺群颜奉丽
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1