一种基于标签优化的图像再识别系统及损失函数确定方法技术方案

技术编号:20160963 阅读:34 留言:0更新日期:2019-01-19 00:13
本发明专利技术公开一种基于标签优化的图像再识别损失函数确定方法,包括获取原始多张有标签的图片,并通过生成对抗网络生成多张没有标签的图片;对每张有标签的图片和每张没有标签的图片进行特征提取;计算多个类的所述多张有标签的图片的类中心和所述多张没有标签的图片的多个簇及每个簇的簇中心;计算所述簇中心和每个所述类中心的欧式距离;根据所述欧式距离计算每个簇到所述多个类的损失函数的概率系数,得到损失函数,本发明专利技术还公开了一种基于标签优化的图像再识别系统,解决有标签的图片不多时易出现的过拟合现象,提高再识别准确度。

【技术实现步骤摘要】
一种基于标签优化的图像再识别系统及损失函数确定方法
本专利技术涉及机器学习
更具体地,涉及一种基于标签优化的图像再识别系统及损失函数确定方法。
技术介绍
当今再识别技术通过使用不同的深度学习网络架构(如CNN,ResNet和VGGNet等)和复杂算法(如RBM,Adam和RMSprop等),加上在日渐先进的硬件条件(GPU)帮助下已经达到了很高的准确度,但是有一种最简单的方法,通过增大数据集来让网络学到更加准确的数据特征提高准确度。但是获得有标签的数据是比较昂贵的,所以就通过增加没有标签的数据集来进行训练。增加没有标签的数据方式比较多也比较容易,如直接从网络上下载,对有标签的数据去标签等,如今最新的方法就是使用生成对抗网络(Generativeadversarialnets,GAN)生成没有标签的图片,原因是省去了从网上下载数据的工作,并且GAN生成图片来自于原始图片,故这些图片会尽量和原始图片来自于同一个分布。对GAN生成的没有标签的数据集,现有三种方法处理:1)Allinone:把所有没有标记的图片当作一个类;2)Pseudolabel:每一张没有标签的图片求得对所有类的概率,有最大的概率的类就将这个类的标签分配给图片;3)LSRO(LabelSmoothingRegularizationforOutliers):一个标签可能来源是其他所有类的线性组合,没有标签的图片不属于任何一类,是所有类的线性组合,且系数都是1/K,K是有标签数据的类的总数,在损失函数中,每个标签是每个类概率的log形式的均匀分布,但是,当有标签的图片过少时易出现过拟合的情况。
技术实现思路
本专利技术的一个目的在于提供一种基于标签优化的图像再识别损失函数确定方法,本专利技术的另一个目的在于提供一种基于标签优化的图像再识别系统,解决有标签的图片不多时易出现的过拟合现象,提高再识别准确度。为达到上述目的,本专利技术采用下述技术方案:本专利技术一方面公开了一种基于标签优化的图像再识别损失函数确定方法,包括获取原始多张有标签的图片,并通过生成对抗网络生成多张没有标签的图片;对每张有标签的图片和每张没有标签的图片进行特征提取;计算多个类的所述多张有标签的图片的类中心和所述多张没有标签的图片的多个簇及每个簇的簇中心;计算所述簇中心和每个所述类中心的欧式距离;根据所述欧式距离计算每个簇到所述多个类的损失函数的概率系数,得到损失函数。优选地,所述对每张有标签的图片和每张没有标签的图片进行特征提取具体包括:所述有标签的图片和没有标签的图片为RGB图片;每张图片特征提取后表示为x=[mean_r,mean_g,mean_b,mean_dot]其中,mean_r是图片的R通道所有像素的平均值,mean_g是图片的G通道所有像素的平均值,mean_b是图片的B通道所有像素的平均值,mean_dot是mean_r、mean_g和mean_b的加权平均值。优选地,每个类的类中心为该类的有标签的图片的特征的和与该类所有图片的数量的比值。优选地,所述类中心centroid为其中,k为有标签的图片的数量。优选地,计算所述多张没有标签的图片的多个簇及每个簇的簇中心具体包括:计算各图片间的相似矩阵;计算所述相似矩阵的对角矩阵;计算Laplacian矩阵及Laplacian的最优解特征向量;将所有没有标签的图片的最优解特征向量形成求解矩阵并对矩阵中的每一行做归一化处理;对归一化处理后的求解矩阵通过K-means算法进行聚类得到多个簇及每个簇对应的多张没有标签的图片;计算每个簇的簇中心。优选地,所述类中心为其中,k’为没有标签的图片的数量。优选地,所述簇中心和每个所述类中心的欧式距离为||xclustering_centroids-xcentroids||.2其中,xcentroids为类中心的坐标,xclustering_centroids为簇中心的坐标。优选地,所述概率系数为其中,xcentroids为类中心的坐标,为第i个簇中心的坐标,dismax为一个簇中心到其他所有类中心的距离的最大值,smallGANdataset为小于预设值的簇中心,largeGANdataset为大于等于预设值的簇中心。优选地,所述损失函数为其中,K为没有标签的图片的数量,当计算没有标签的图片时,Z=1,计算有标签的图片时,Z=0,p(y)为有标签的图片分布,p(k)为没有标签的图片分布。本专利技术另一方面公开了一种基于标签优化的图像再识别系统,包括无监督学习模块、数据集融合模块、半监督学习模块和测试模块;所述无监督学习模块用于对有标签的图片进行无监督的训练,生成没有标签的图片;所述数据集融合模块用于将有标签的图片和没有标签的图片进行随机融合;所述半监督学习模块用于对随机融合的图片根据如上所述的损失函数进行训练,得到测试模型;所述测试模块用于根据所述测试模型进行再识别,输出识别结果。本专利技术的有益效果如下:本专利技术提供的这种将GAN生成的没有标签的图片使用在半监督的行人再识别的baseline进行训练方法,重点解决了当有标签的数据不够多时,如何使用没有标签的数据进行训练的问题。由于训练的数据增多了,根据机器学习理论可知,有效的减少了过拟合现象的发生。本方法不仅限于行人再识别,将对一系列再识别,如车再识别等问题又具有一定的适用性,具有广泛的前景。附图说明下面结合附图对本专利技术的具体实施方式作进一步详细的说明。图1示出本专利技术一种基于标签优化的图像再识别损失函数确定方法一个具体实施例的示意图。图2示出普通的聚类算法的聚类结果。图3示出本专利技术谱聚类算法的聚类结果。图4示出当原始有标签的图片数量少时本专利技术谱聚类算法的聚类结果。图5示出ploss函数的曲线图。图6示出本专利技术用于行人再识别原理图。图7示出本专利技术一种基于标签优化的图像再识别系统一个具体实施例的示意图。具体实施方式为了更清楚地说明本专利技术,下面结合优选实施例和附图对本专利技术做进一步的说明。附图中相似的部件以相同的附图标记进行表示。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本专利技术的保护范围。如图1所示,基于本专利技术的一个方面,公开了一种基于标签优化的图像再识别损失函数确定方法,本实施例中,所述方法包括:S101:获取原始多张有标签的图片,并通过生成对抗网络生成多张没有标签的图片。S102:对每张有标签的图片和每张没有标签的图片进行特征提取。将有标签的图片和没有标签的图片进行简单的特征提取,把每张RGB图片分成4个特征[mean_r,mean_g,mean_b,mean_dot],mean_r是图片的R通道所有像素的平均值,mean_g是图片的G通道所有像素的平均值,mean_b是图片的B通道所有像素的平均值,mean_dot是前三个特征的加权平均值,比如:mean_r=178,mean_g=225,mean_b=78,那么权值就是w=[0.4,0.5,0.1],将权值和前三个特征做内积作为第四个特征,这样做的理由是,行人再识别数据集中,每个类是同一个人再不同摄像头下的不同抓拍景象,那么这个类中所有图片的RGB三个通道值就会很类似,第四个特征指示的是,某张图片某个通道的值大,那这张图片的像素加权平均值就会靠近那个通道的本文档来自技高网
...

【技术保护点】
1.一种基于标签优化的图像再识别损失函数确定方法,其特征在于,包括获取原始多张有标签的图片,并通过生成对抗网络生成多张没有标签的图片;对每张有标签的图片和每张没有标签的图片进行特征提取;计算多个类的所述多张有标签的图片的类中心和所述多张没有标签的图片的多个簇及每个簇的簇中心;计算所述簇中心和每个所述类中心的欧式距离;根据所述欧式距离计算每个簇到所述多个类的损失函数的概率系数,得到损失函数。

【技术特征摘要】
1.一种基于标签优化的图像再识别损失函数确定方法,其特征在于,包括获取原始多张有标签的图片,并通过生成对抗网络生成多张没有标签的图片;对每张有标签的图片和每张没有标签的图片进行特征提取;计算多个类的所述多张有标签的图片的类中心和所述多张没有标签的图片的多个簇及每个簇的簇中心;计算所述簇中心和每个所述类中心的欧式距离;根据所述欧式距离计算每个簇到所述多个类的损失函数的概率系数,得到损失函数。2.根据权利要求1所述的方法,其特征在于,所述对每张有标签的图片和每张没有标签的图片进行特征提取具体包括:所述有标签的图片和没有标签的图片为RGB图片;每张图片特征提取后表示为x=[mean_r,mean_g,mean_b,mean_dot]其中,mean_r是图片的R通道所有像素的平均值,mean_g是图片的G通道所有像素的平均值,mean_b是图片的B通道所有像素的平均值,mean_dot是mean_r、mean_g和mean_b的加权平均值。3.根据权利要求1所述的方法,其特征在于,每个类的类中心为该类的有标签的图片的特征的和与该类所有图片的数量的比值。4.根据权利要求3所述的方法,其特征在于,所述类中心centroid为其中,k为有标签的图片的数量。5.根据权利要求1所述的方法,其特征在于,计算所述多张没有标签的图片的多个簇及每个簇的簇中心具体包括:计算各图片间的相似矩阵;计算所述相似矩阵的对角矩阵;计算Laplacian矩阵及Laplacian的最优解特征向量;将所有没有标签的图片的最优解特征向量形成求解矩阵并对矩阵中的每一行做归一化处理;对归...

【专利技术属性】
技术研发人员:郎丛妍余坤宏李浥东冯松鹤王涛
申请(专利权)人:北京交通大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1