一种二分类网络的非监督训练方法技术

技术编号：21454805 阅读：20 留言：0更新日期：2019-06-26 05:03

本发明专利技术提供了一种二分类网络的非监督训练方法，属于图像处理、深度学习、模式识别领域。本发明专利技术通过对样本数据的一系列处理，对聚类网络进行不同阶段的训练，使用训练好的聚类网络对图像进行分类，避免了监督样本的缺乏，数据标注所需数据获取难度过大、成本过高的问题，使聚类网络的训练及分类结果的实现更为简单、高效。

全部详细技术资料下载

【技术实现步骤摘要】
一种二分类网络的非监督训练方法
本专利技术属于图像处理、深度学习、模式识别领域，特别涉及一种二分类网络的非监督训练方法。
技术介绍
伴随着深度学习的发展，分类网络被广泛应用于人脸识别、图像检索、公共监测、生物识别、智能汽车、医疗辅助以及遥感探测等诸多领域。得益于深度神经网络优异的特征表征能力，深度分类网络可以获得接近人类的分类性能。目前的分类网络多为监督学习网络，使用图像和对应标签对网络进行训练(即有监督训练方式)，因此需要大量标注数据。数据标注过程通常需要消耗大量人力和时间。因此，在某些数据获取难度大、成本高的应用领域，监督样本的缺乏成为限制深度分类网络效果的主要因素。不同于有监督网络，聚类方法不需要监督样本，可以通过对样本集合的分析实现分类。因此，如何实现分类网络的非监督训练的研究具有重要意义。
技术实现思路
本专利技术的目的在于解决现有技术中监督学习网络需要大量带标签样本的问题，提出了一种二分类网络的非监督训练方法。一种二分类网络的非监督训练方法，包括以下步骤：S1、采集图像构建数据集S，其中，所述数据集包含待聚类图像，所述数据集中图像数量为M，任意图像为I；S2、构建聚类网络，其中，所述聚类网络包含卷积层、池化层及全连接层，所述全连接层的输出作为所述聚类网络的输出；S3、训练聚类网络，在数个阶段训练中生成参与训练的图像的对应标签集，并基于参与训练的图像及对应的标签集对所述聚类网络进行训练，得到最终网络模型训练参数；S4、将所述数据集输入至训练好的聚类网络，得到所述数据集中图像的分类输出。进一步地，所述步骤S2包括：构建聚类网络，其中，所述聚类网络包含卷...

【技术保护点】
1.一种二分类网络的非监督训练方法，其特征在于，包括以下步骤：S1、采集图像构建数据集S，其中，所述数据集包含待聚类图像，所述数据集中图像数量为M，任意图像为I；S2、构建聚类网络，其中，所述聚类网络包含卷积层、池化层及全连接层，所述全连接层的输出作为所述聚类网络的输出；S3、训练聚类网络，在数个阶段训练中生成参与训练的图像的对应标签集，并基于参与训练的图像及对应的标签集对所述聚类网络进行训练，得到最终网络模型训练参数；S4、将所述数据集输入至训练好的聚类网络，得到所述数据集中图像的分类输出。

【技术特征摘要】
1.一种二分类网络的非监督训练方法，其特征在于，包括以下步骤：S1、采集图像构建数据集S，其中，所述数据集包含待聚类图像，所述数据集中图像数量为M，任意图像为I；S2、构建聚类网络，其中，所述聚类网络包含卷积层、池化层及全连接层，所述全连接层的输出作为所述聚类网络的输出；S3、训练聚类网络，在数个阶段训练中生成参与训练的图像的对应标签集，并基于参与训练的图像及对应的标签集对所述聚类网络进行训练，得到最终网络模型训练参数；S4、将所述数据集输入至训练好的聚类网络，得到所述数据集中图像的分类输出。2.如权利要求1所述的二分类网络的非监督训练方法，其特征在于，所述步骤S2包括：构建聚类网络，其中，所述聚类网络包含卷积层、池化层及全连接层，所述全连接层的输出作为所述聚类网络的输出；将所述数据集S中的图像的大小统一为(H，W，C)，随机打乱后输入至所述聚类网络中，其中，H表示图像高度，W表示图像宽度，C表示图像通道数；所述聚类网络输入为四维向量(M，H，W，C)，分类输出类别数为2，所述聚类网络输出为二维张量(M，2)表示的二类聚类输出矩阵V，由所述矩阵V可得一维向量(M，1)表示的预测类别向量L，其中，L中元素Li表示聚类类别，表示为Li＝argmax(V(i,1),V(i,2))其中，V(i,1)、V(i,2)分别表示矩阵V中对应索引处的元素值。3.如权利要求2所述的二分类网络的非监督训练方法，其特征在于，所述步骤S3包括：S31、将所述数据集S中所有图像的标签设置为(0，0)，与原图像构成第一训练样本集dataset0对所述聚类网络进行训练，训练损失函数为二范数损失损失函数其中，G为图像对应标签，V(i)表示矩阵V中对应的第i个图像对应的输出向量；采用随机梯度下降法训练网络权重，经过s1步迭代后，得到第一网络权重ω1；S32、在所述数据集S中任意选择一个图像作为正样本，将所述正样本的标签设置为(1，0)，对应类别为A，其余图像标签设置为(0，0)，将所述正样本复制M份，与所述数据集一起构成第二训练样本集dataset1；将所述第二训练样本集dataset1中的数据随机打乱作为训练样本，以所述第一网络权重ω1为初始权重训练网络，经s2步迭代后，得到第二网络权重ω2；S33、将所述步骤S32中训练得到的网络对dataset0中的图像进行预测，将类别A对应预测值进行大小排序，得到最大的Q个预测值对应的Q张图像，设置其对应标签值为(1，0)，其余图像标签设置为(0，0)，得到第三训练样本集dataset2；将所述第三训练样本集dataset2中的数据随机打乱后作为训练样本...

【专利技术属性】
技术研发人员：师君，王琛，周泽南，周远远，杨夏青，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人