基于渐进学习的深度卷积神经网络训练方法与系统技术方案

技术编号:22468230 阅读:31 留言:0更新日期:2019-11-06 11:59
本发明专利技术公开了一种基于渐进学习的深度卷积神经网络训练方法与系统。该方法首先按常规方法从样本数据集里任意选取样本,对深度卷积神经网络进行预训练;然后将样本数据集里的样本按类别依次输入到预训练得到的网络模型中提取特征,并根据提取的特征向量计算样本的类内局部密集度和类内距离,使用聚类方法将每一类样本划分为容易分类、较易分类和不易分类三个样本子集;再合并所有类别的容易分类样本子集、较易分类样本子集和不易分类样本子集;最后按照先易后难的渐进顺序,分三个阶段对深度卷积神经网络进行重新训练。与常规的训练方法相比,该方法能够消除含噪声标签样本对训练网络模型的不利影响,得到更加鲁棒的深度卷积神经网络。

Training method and system of deep convolution neural network based on progressive learning

【技术实现步骤摘要】
基于渐进学习的深度卷积神经网络训练方法与系统
本专利技术属于机器学习领域,涉及一种基于渐进学习的深度卷积神经网络训练方法与系统。
技术介绍
近年来,深度卷积神经网络在人脸识别、图像分类等多种任务中取得了巨大成功。现有的深度卷积神经网络训练方法通过学习大量的良好标记样本对模型进行训练,以便获得较好的模型泛化能力。但是,在实际情况中,样本标签是具有噪声的,比如由于标注者粗心或疲惫造成样本具有部分错误标签,或者一些图像本来就难以分类,特别是对于一些比较专业的数据集的标注是非常困难的,它对标注者的专业知识有一定的要求,而且由于不同标注者之间的思维差异性,他们所提供的标签可能不一致,这些含噪声标签样本可能会严重影响深度卷积神经网络模型的训练及其分类性能。目前,处理含噪声标签样本的方法主要有两种,一种是针对噪声标签的鲁棒算法,另外一种是设计噪声标签清理方法,旨在消除或纠正训练数据中的错误标注。然而,噪声标签清理方法经常会遇到难以区分噪声标签样本与难分类样本的问题,而难分类样本对于提高模型性能是至关重要的。在处理含噪声标签样本方面,现有已公开专利文献中有一项申请公布号为CN109034248A、名本文档来自技高网...

【技术保护点】
1.一种基于渐进学习的深度卷积神经网络训练方法,其特征在于,包括以下步骤:(1)对用于分类的深度卷积神经网络进行初始化后,从样本数据集里任意选取样本,对深度卷积神经网络进行预训练;(2)将样本数据集里的样本按样本的类别依次输入预训练得到的深度卷积神经网络模型中提取特征;(3)根据提取的特征向量计算样本的类内局部密集度和类内距离,并依据两者的乘积或加权和为每一类样本选取三个聚类中心,使用聚类算法将每一类样本分为容易分类样本子集,较易分类样本子集及不易分类样本子集,设样本数据集表示为T,样本类别数为n,第i类的样本数据集表示为Ti,i=1,2,...,n,将Ti分成三个样本子集:容易分类样本子集T...

【技术特征摘要】
1.一种基于渐进学习的深度卷积神经网络训练方法,其特征在于,包括以下步骤:(1)对用于分类的深度卷积神经网络进行初始化后,从样本数据集里任意选取样本,对深度卷积神经网络进行预训练;(2)将样本数据集里的样本按样本的类别依次输入预训练得到的深度卷积神经网络模型中提取特征;(3)根据提取的特征向量计算样本的类内局部密集度和类内距离,并依据两者的乘积或加权和为每一类样本选取三个聚类中心,使用聚类算法将每一类样本分为容易分类样本子集,较易分类样本子集及不易分类样本子集,设样本数据集表示为T,样本类别数为n,第i类的样本数据集表示为Ti,i=1,2,...,n,将Ti分成三个样本子集:容易分类样本子集Ti,1,较易分类样本子集Ti,2及不易分类样本子集Ti,3;(4)将所有类别的容易分类样本子集合并构成E1,较易分类样本子集合并构成E2,不易分类样本子集合并构成E3,即其中,t=1,2,3;(5)按照先易后难的渐进顺序,分三个阶段对深度卷积神经网络进行重新训练,得到训练好的网络模型,其中,第一阶段的训练使用E1中的样本,第二阶段的训练使用E1和E2中的样本,第三阶段的训练使用E1、E2和E3中的样本。2.根据权利要求1所述的一种基于渐进学习的深度卷积神经网络训练方法,其特征在于,所述步骤(3)中为每一类样本数据选取三个聚类中心的方法如下:对于第i类的样本数据集Ti,Ti中包含mi个样本,根据提取的特征向量,计算第i类的第j个样本特征向量与第l个样本特征向量之间的欧几里得距离di,j,l,j=1,2,...,mi,l=1,2,...,mi,并进行排序,得到中值di,th;对于第i类的第j个样本,定义其类内局部密集度ρi,j和类内距离δi,j分别为:其中,对第i类样本类内局部密集度ρi,j和类内距离δ...

【专利技术属性】
技术研发人员:卢官明李凯丽卢峻禾闫静杰
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1