【技术实现步骤摘要】
卷积神经网络模型的建模方法及装置
本专利技术实施例涉及计算机领域,具体涉及一种卷积神经网络模型的建模方法及装置。
技术介绍
神经网络模型存在过拟合现象。就是说神经网络训练得到的模型过度拟合训练数据集,在测试集或其他独立数据集上的拟合效果差,泛化性能不理想。有限的训练数据集不可能涵盖所有的特征,神经网络的过拟合问题会严重影响神经网络在现实应用场景中的使用。卷积神经网络作为一种特殊的神经网络,同样存在过拟合现象。Dropout算法是一种针对全连接神经网络提出的防止过拟合算法,该算法在防止全连接神经网络过拟合问题上效果明显。近几年卷积神经网络在各领域应用广泛,其同样面临网络模型过拟合的问题。由于卷积神经网络一般会在网络模型最后几层使用全连接层对特征进行分类,为防止卷积神经网络过拟合,研究人员将Dropout算法应用于卷积神经网络的全连接层中。但是,这种Dropout的使用方式有时无法取得明显的防止过拟合的效果。DeepID是香港中文大学设计的一个专门用于人脸识别的卷积神经网络模型,该模型在全连接层上使用了Dropout。DeepID由四个卷积层、三个池化层和两个全连接层 ...
【技术保护点】
1.一种卷积神经网络模型的建模方法,其特征在于,包括:S1、利用训练数据集对预先构建的卷积神经网络模型进行训练,得到训练好的卷积神经网络模型,其中,在构建所述卷积神经网络模型时,随机将所述卷积神经网络模型的至少一个卷积层的每个神经元与前一层的神经元连接所使用的卷积核的至少一个参数设置为0;S2、利用测试数据集对所述训练好的卷积神经网络模型进行测试。
【技术特征摘要】
1.一种卷积神经网络模型的建模方法,其特征在于,包括:S1、利用训练数据集对预先构建的卷积神经网络模型进行训练,得到训练好的卷积神经网络模型,其中,在构建所述卷积神经网络模型时,随机将所述卷积神经网络模型的至少一个卷积层的每个神经元与前一层的神经元连接所使用的卷积核的至少一个参数设置为0;S2、利用测试数据集对所述训练好的卷积神经网络模型进行测试。2.根据权利要求1所述的方法,其特征在于,所述卷积神经网络模型为DeepID网络模型。3.根据权利要求2所述的方法,其特征在于,所述至少一个卷积层为所述DeepID网络模型的靠后的三个卷积层。4.一种卷积神经网络模型的建模装置,其特征在于,包括:训练单元,用于利用训练数据集对预先构建的卷积神经网络模型进行训练,得到训练好的卷积神经网络模型,其中,在构建所述卷积神经网络模型时,随机将所...
【专利技术属性】
技术研发人员:王衍洋,唐文忠,史胜阳,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。