一种基于卷积神经网络的模型稀疏方法技术

技术编号：33351146 阅读：19 留言：0更新日期：2022-05-08 09:56

本申请提供一种基于卷积神经网络的模型稀疏方法。解决了提高稀疏模型精度的技术问题。模型稀疏方法包括：根据预训练模型的稀疏需求，设定稀疏比例s

全部详细技术资料下载

【技术实现步骤摘要】
一种基于卷积神经网络的模型稀疏方法

[0001]本申请涉及卷积神经网络
，尤其涉及一种基于卷积神经网络的模型稀疏方法。

技术介绍

[0002]卷积神经网络中涉及大量的数据量和计算量，直接使用训练后的模型，往往参数量较大，推理计算量和时间较长。通过对模型进行参数稀疏化，能够有效地降低计算复杂度和存储开销，从而满足端侧设备实时处理的需求。模型稀疏的将大量的冗余变量去除，只保留与响应变量最相关的解释变量，简化了模型的同时却保留了数据集中最重要的信息，有效地解决了高维数据集建模中的诸多问题，稀疏模型具有更好的解释性，便于数据可视化、减少计算量和传输存储。
[0003]目前，模型稀疏算法通常需要根据特定的指标，例如参数的绝对值大小，将一定比例的参数设置为待稀疏的参数，并置零，从而完成对模型的稀疏。为保持模型精度，在模型稀疏之前需要对待稀疏的参数增加L2或者L1范数罚正则化项，然后进行模型训练，使得在训练的过程中，将部分参数值惩罚训练趋向于0，在完成该部分参数压缩的训练后，将待稀疏的参数置0，从而得到稀疏后的模型，再次对稀疏后模型进行重训练，从而得到最后满足精度需求的稀疏模型。
[0004]然而，通过上述方法不能满足稀疏模型日益提高的精度需求。

技术实现思路

[0005]本申请提供了一种基于卷积神经网络的模型稀疏方法，解决了提高稀疏模型精度的技术问题。
[0006]第一方面，本申请提供一种基于卷积神经网络的模型稀疏方法，模型稀疏方法包括：
[0007]根据预训练模型的稀疏需求...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络的模型稀疏方法，其特征在于，包括：根据预训练模型的稀疏需求，设定稀疏比例s
l
；根据所述s
l
，稀疏所述预训练模型中每层的参数W
l
，得到稀疏模型；计算第一中间结果和第二中间结果的误差损失；其中，所述第一中间结果为所述预训练模型第1层的中间结果；所述第二中间结果为所述稀疏模型中第1层的中间结果；根据预设权重，对所述误差损失加权，得到加权结果；将所述加权结果累加至模型预测误差上，得到最终损失；根据所述最终损失，更新所述稀疏模型的网络参数。2.根据权利要求1所述的基于卷积神经网络的模型稀疏方法，其特征在于，所述根据所述s
l
，稀疏所述预训练模型中每层的参数W
l
，得到稀疏模型的步骤，包括：根据Topk算法，找到当前层的阈值t
l
＝TOPk(abs(W
l
)，n
l
*(1
‑
s
l
))；其中，n
l
表示W
l
的参数数目，abs表示取绝对值；根据所述阈值t
l
，对所述参数W
l
进行稀疏；若abs(W
l
)大于等于阈值t
l
，则保留所述参数W
l
；若abs(W
l
)小于阈值t
l
，则所述参数W
l

【专利技术属性】
技术研发人员：刘阳，鲁金铭，
申请(专利权)人：南京风兴科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人