当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于可靠价值样本和新身份样本挖掘的行人重识别域适应方法技术

技术编号:30827082 阅读:32 留言:0更新日期:2021-11-18 12:28
本分明公开了一种基于可靠价值样本和新身份样本挖掘的行人重识别域适应方法,该方法通过对目标域中已有样本的挖掘和未知样本的探索对目标域数据分布进行适应。一方面通过衡量样本伪标签的可靠性和信息量进行样本选择,另一方面通过样本混合的方式创造潜在的新身份样本用于域适应。本发明专利技术设计使用合适的训练样本用于模型对目标域分布的适应和优化,提升了目标域模型的鲁棒性和泛化性。了目标域模型的鲁棒性和泛化性。了目标域模型的鲁棒性和泛化性。

【技术实现步骤摘要】
一种基于可靠价值样本和新身份样本挖掘的行人重识别域适应方法


[0001]本专利技术属于智能识别
,特别地涉及了一种基于可靠价值样本和新身份样本挖掘的行人重识别域适应方法。在算法设计和模型训练部分涉及了深度学习技术。

技术介绍

[0002]行人重识别的任务是在于摄像机A不存在重叠区域的摄像机B中,对行人目标进行检索,重新找到在摄像机A中出现的行人目标。作为当前重要的研究方向和研究热点,行人重识别在智能监控、智慧城市、治安防治和刑侦等领域都有着广泛的应用,例如跨摄像机的行人跟踪与行为分析,嫌疑或感兴趣人员的图片检索与查询等。
[0003]随着深度学习技术的迅速发展以及卷积神经网络强大的学习拟合能力,基于身份标签的行人重识别算法已经在主流数据集上获得了非常高的识别准确率和首位命中率,甚至超越了人眼的识别能力。然而对于行人身份类别的标注是一项非常繁琐且消耗大量人力的工程,同时在现实监控场景中,每时每刻都有海量的新行人数据产生,对如此大量的数据进行人为标注变得越来越不可行,因此,如何基于当前已有的标注好的数据和训练好的模型,对未知场景分布的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于可靠价值样本和新身份样本挖掘的行人重识别域适应方法,其特征在于,包括以下步骤:步骤一:在源域数据上训练一个行人目标重识别模型F。步骤二:利用模型F为目标域数据进行聚类,根据聚类结果分配伪标签;步骤三:在目标域数据中根据聚类结果选取聚类可靠性高且聚类价值性高的样本及其对应的伪标签组成目标域中可靠且有价值的样本集合{X
r
,Y
r
};具体通过如下子步骤获得:(3.1)对于目标域中的每个样本,根据聚类结果计算其聚类可靠性,选取可靠性高的样本及其对应的伪标签组成可靠样本集合{X
c
,Y
c
};其中所述聚类可靠性为每个目标域样本根据模型F获得的特征和与该特征最接近的聚类中心,以及第二近的聚类中心相似性的比值,比值越高可靠性越高。(3.2)对于目标域中的每个样本,根据聚类结果计算其聚类价值性,选取价值性高的样本及其对应的伪标签组成价值样本集合{X
v
,Y
v
};所述聚类价值性为每个目标域样本根据模型F获得的特征与其他一目标域样本特征的不相似性,不相似性越高价值性越高。其中,其他一目标域样本特征为根据该目标域样本与其他目标域样本的特征相似性按从高到低排序后的第k个其他目标域样本特征,所述不相似性为相似性的倒数。(3.3)在可靠样本集合{X
c
,Y
c
}和价值样本集合{X
v
,Y
v
}中找到共同出现的样本,获得目标域中可靠且有价值的样本集合{X
r
,Y
r
}。步骤四:利用源域数据{X
s
,Y
s
}和目标域中可靠且有价值的样本集合{X
r
,Y
r
}生成新身份样本集合{X
n
,Y
n
};步骤五:利用目标域中可靠且有价值的样本集合{X
r
,Y
r
}和新身份样本集合{X
n
,Y
n
}训练更新模型F;步骤六:重复步骤二至步骤五,直至模型收敛,获得最终的目标域模型F。2.根据权利要求1所述的方法,其特征在于,(3.1)中的聚类可靠性和可靠样本集合{X
c
,Y
c
},通过以下步骤计算:(3.1.1)计算每个聚类的聚类中心c,由聚类中所有样本的特征求平均获得;(3.1.2)对于每个目标域样本{x
t
,y
t
},通过模型F计算特征f
t
,寻找与其最近的聚类中心c
i
,以及第二近的聚类中心c
o
;(3.1.3)利用下式计算目标域样本{x
t
,y
...

【专利技术属性】
技术研发人员:于慧敏李殊昭闫禹铭
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1