基于卷积神经网络预训练模型的卷积核激活值正则化方法和系统技术方案

技术编号：39039208 阅读：23 留言：0更新日期：2023-10-10 11:52

基于卷积神经网络预训练模型的卷积核激活值正则化方法和系统，其方法包括：1)预训练卷积神经网络模型；2)计算卷积核产生的激活值的重要程度；3)正则化处理卷积核产生的激活值，产生新的激活值，使用新的激活值代替原先的激活值；4)基于正则化处理之后的卷积神经网络模型对图像进行分类。本发明专利技术找到卷积神经网络预训练模型中每个卷积核产生的激活值的重要程度，基于激活值的重要程度对卷积核激活值进行正则化处理。根据分类结果计算损失函数，利用损失函数对卷积神经网络的参数进行更新，提升预训练卷积神经网络的图像分类性能。提升预训练卷积神经网络的图像分类性能。提升预训练卷积神经网络的图像分类性能。

全部详细技术资料下载

【技术实现步骤摘要】
基于卷积神经网络预训练模型的卷积核激活值正则化方法和系统

[0001]本专利技术属于模型优化领域，具体涉及卷积神经网络预训练模型的卷积核激活值正则化方法和系统。

技术介绍

[0002]卷积神经网络(Convolutional Neural Network，CNN)是一类包含卷积计算并且含有深层次结构的深度神经网络。卷积神经网络隐含层中的卷积层与池化层交替连接，这些隐含层构成了卷积神经网络的核心模块，高层一般由全连接层构成。卷积神经网络目前在图片分类、相似图搜索、医学图像等领域都有着广泛的应用。
[0003]然而，尽管卷积神经网络具有强大图像数据处理能力，但在研究人员看来，它仍然有很大的优化空间，如设计不同的网络结构、设计不同的损失函数、使用设计更为复杂的优化器等。
[0004]近年来，卷积核激活值正则化方法的进展主要集中在模型量化、模型剪枝、模型蒸馏、网络结构设计、损失函数设计等方面，对预训练卷积神经网络模型的卷积核激活值进行正则处理的技术方向仍处于空白阶段。
[0005]模型量化通过将模型参数的精度降低到较低的位数，可以显著减少计算和存储资源的使用，而对模型性能的影响相对较小；模型剪枝通过去除不必要的连接和节点来减小模型的规模，从而降低资源需求；模型蒸馏通过将大型模型的知识转移给小型模型，以提高小型模型的性能。此外，通过网络结构设计可以使得模型在手机等低算力设备上进行模型的推理过程；针对数据的分布情况可以设计针对性的损失函数，使得模型可以更好地收敛。虽然这些技术对模型进行了一定程度的优化，但...

【技术保护点】

【技术特征摘要】
1.基于卷积神经网络预训练模型的卷积核激活值正则化方法，包括以下步骤：S1.预训练卷积神经网络模型；给定任意的卷积神经网络模型，使用交叉熵损失函数在某个图像分类数据集上训练至模型收敛，得到一个预训练权重；该权重将作为下面步骤中模型的初始化；S2.计算卷积核产生的激活值的重要程度；S2.1使用预训练权重初始化卷积神经网络模型；使用和步骤S1中相同的卷积神经网络，并使用步骤S1中得到的预训练权重初始化卷积神经网络模型；S2.2获取卷积核激活值对应分布的均值和方差；对于卷积神经网络的第l层卷积层上的卷积核k，其激活值对应的高斯分布的均值为μ
k
，标准差为σ
k
，这两个参数值在第l层卷积层之后的批归一化层的模型参数中直接获取；S2.3计算卷积核产生激活值的重要程度；对于单张图像，该图像在第l层卷积层的卷积核k上产生的激活值设为a
k
；如果激活值a
k
越靠近对应卷积核k的均值μ
k
，这个激活值需要给予较大的权重；如果激活值a
k
越远离卷积核k的均值μ
k
，则该激活值需要给予较小的权重；根据该形式下的卷积核激活值重要程度的定义，可以使用高斯函数积分的变体计算激活值的重要程度：如果激活值小于等于均值，则取高斯函数在激活值位置的积分；如果激活值大于均值，则取激活值关于均值对称位置的积分；公式化表述如下：对于单张图像在卷积核k上产生的激活值a
k
，如果a
k
≤μ
k
，则权重值w
k
的计算公式如下：其中，μ
k<...

【专利技术属性】
技术研发人员：宋明黎，徐文祥，陈琳，贾志杰，冯尊磊，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人