【技术实现步骤摘要】
一种基于标签优化的图像再识别系统及损失函数确定方法
本专利技术涉及机器学习
更具体地,涉及一种基于标签优化的图像再识别系统及损失函数确定方法。
技术介绍
当今再识别技术通过使用不同的深度学习网络架构(如CNN,ResNet和VGGNet等)和复杂算法(如RBM,Adam和RMSprop等),加上在日渐先进的硬件条件(GPU)帮助下已经达到了很高的准确度,但是有一种最简单的方法,通过增大数据集来让网络学到更加准确的数据特征提高准确度。但是获得有标签的数据是比较昂贵的,所以就通过增加没有标签的数据集来进行训练。增加没有标签的数据方式比较多也比较容易,如直接从网络上下载,对有标签的数据去标签等,如今最新的方法就是使用生成对抗网络(Generativeadversarialnets,GAN)生成没有标签的图片,原因是省去了从网上下载数据的工作,并且GAN生成图片来自于原始图片,故这些图片会尽量和原始图片来自于同一个分布。对GAN生成的没有标签的数据集,现有三种方法处理:1)Allinone:把所有没有标记的图片当作一个类;2)Pseudolabel:每一张没有标签 ...
【技术保护点】
1.一种基于标签优化的图像再识别损失函数确定方法,其特征在于,包括获取原始多张有标签的图片,并通过生成对抗网络生成多张没有标签的图片;对每张有标签的图片和每张没有标签的图片进行特征提取;计算多个类的所述多张有标签的图片的类中心和所述多张没有标签的图片的多个簇及每个簇的簇中心;计算所述簇中心和每个所述类中心的欧式距离;根据所述欧式距离计算每个簇到所述多个类的损失函数的概率系数,得到损失函数。
【技术特征摘要】
1.一种基于标签优化的图像再识别损失函数确定方法,其特征在于,包括获取原始多张有标签的图片,并通过生成对抗网络生成多张没有标签的图片;对每张有标签的图片和每张没有标签的图片进行特征提取;计算多个类的所述多张有标签的图片的类中心和所述多张没有标签的图片的多个簇及每个簇的簇中心;计算所述簇中心和每个所述类中心的欧式距离;根据所述欧式距离计算每个簇到所述多个类的损失函数的概率系数,得到损失函数。2.根据权利要求1所述的方法,其特征在于,所述对每张有标签的图片和每张没有标签的图片进行特征提取具体包括:所述有标签的图片和没有标签的图片为RGB图片;每张图片特征提取后表示为x=[mean_r,mean_g,mean_b,mean_dot]其中,mean_r是图片的R通道所有像素的平均值,mean_g是图片的G通道所有像素的平均值,mean_b是图片的B通道所有像素的平均值,mean_dot是mean_r、mean_g和mean_b的加权平均值。3.根据权利要求1所述的方法,其特征在于,每个类的类中心为该类的有标签的图片的特征的和与该类所有图片的数量的比值。4.根据权利要求3所述的方法,其特征在于,所述类中心centroid为其中,k为有标签的图片的数量。5.根据权利要求1所述的方法,其特征在于,计算所述多张没有标签的图片的多个簇及每个簇的簇中心具体包括:计算各图片间的相似矩阵;计算所述相似矩阵的对角矩阵;计算Laplacian矩阵及Laplacian的最优解特征向量;将所有没有标签的图片的最优解特征向量形成求解矩阵并对矩阵中的每一行做归一化处理;对归...
【专利技术属性】
技术研发人员:郎丛妍,余坤宏,李浥东,冯松鹤,王涛,
申请(专利权)人:北京交通大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。