卷积神经网络模型的建模方法及装置制造方法及图纸

技术编号：19779227 阅读：70 留言：0更新日期：2018-12-15 11:38

本发明专利技术实施例公开一种卷积神经网络模型的建模方法及装置，能解决全连接Dropout算法抑制过拟合效果不明显的问题。方法包括：S1、利用训练数据集对预先构建的卷积神经网络模型进行训练，得到训练好的卷积神经网络模型，其中，在构建所述卷积神经网络模型时，随机将所述卷积神经网络模型的至少一个卷积层的每个神经元与前一层的神经元连接所使用的卷积核的至少一个参数设置为0；S2、利用测试数据集对所述训练好的卷积神经网络模型进行测试。

全部详细技术资料下载

【技术实现步骤摘要】
卷积神经网络模型的建模方法及装置
本专利技术实施例涉及计算机领域，具体涉及一种卷积神经网络模型的建模方法及装置。
技术介绍
神经网络模型存在过拟合现象。就是说神经网络训练得到的模型过度拟合训练数据集，在测试集或其他独立数据集上的拟合效果差，泛化性能不理想。有限的训练数据集不可能涵盖所有的特征，神经网络的过拟合问题会严重影响神经网络在现实应用场景中的使用。卷积神经网络作为一种特殊的神经网络，同样存在过拟合现象。Dropout算法是一种针对全连接神经网络提出的防止过拟合算法，该算法在防止全连接神经网络过拟合问题上效果明显。近几年卷积神经网络在各领域应用广泛，其同样面临网络模型过拟合的问题。由于卷积神经网络一般会在网络模型最后几层使用全连接层对特征进行分类，为防止卷积神经网络过拟合，研究人员将Dropout算法应用于卷积神经网络的全连接层中。但是，这种Dropout的使用方式有时无法取得明显的防止过拟合的效果。DeepID是香港中文大学设计的一个专门用于人脸识别的卷积神经网络模型，该模型在全连接层上使用了Dropout。DeepID由四个卷积层、三个池化层和两个全连接层组成，最后使用SoftMax分类器对数据进行分类，为防止网络模型过拟合，DeepID在第一个全连接层后使用了Dropout。申请人在实施本专利技术的过程中发现，Dropout算法的原理是它切断了神经元之间的固定联系，减弱了神经元之间的共适应性，使得单个神经元需要和不同的其他神经元组合一起工作，增强了单个神经元提取特征的能力，强迫模型选取鲁棒性更强的数据特征。而DeepID模型中，Dropout算法...

【技术保护点】
1.一种卷积神经网络模型的建模方法，其特征在于，包括：S1、利用训练数据集对预先构建的卷积神经网络模型进行训练，得到训练好的卷积神经网络模型，其中，在构建所述卷积神经网络模型时，随机将所述卷积神经网络模型的至少一个卷积层的每个神经元与前一层的神经元连接所使用的卷积核的至少一个参数设置为0；S2、利用测试数据集对所述训练好的卷积神经网络模型进行测试。

【技术特征摘要】
1.一种卷积神经网络模型的建模方法，其特征在于，包括：S1、利用训练数据集对预先构建的卷积神经网络模型进行训练，得到训练好的卷积神经网络模型，其中，在构建所述卷积神经网络模型时，随机将所述卷积神经网络模型的至少一个卷积层的每个神经元与前一层的神经元连接所使用的卷积核的至少一个参数设置为0；S2、利用测试数据集对所述训练好的卷积神经网络模型进行测试。2.根据权利要求1所述的方法，其特征在于，所述卷积神经网络模型为DeepID网络模型。3.根据权利要求2所述的方法，其特征在于，所述至少一个卷积层为所述DeepID网络模型的靠后的三个卷积层。4.一种卷积神经网络模型的建模装置，其特征在于，包括：训练单元，用于利用训练数据集对预先构建的卷积神经网络模型进行训练，得到训练好的卷积神经网络模型，其中，在构建所述卷积神经网络模型时，随机将所...

【专利技术属性】
技术研发人员：王衍洋，唐文忠，史胜阳，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人