【技术实现步骤摘要】
一种基于区域匹配网络的行人检索方法
本专利技术属于计算机视觉
,涉及一种监控视频的行人检索方法,具体涉及一种基于区域匹配网络的行人检索方法。技术背景传统的视频检索技术侧重于分析特定场景下的特定某类对象的行为语义,而对于监控场景下视频往往由于摄像头视角的影响,会造成光照变化、遮挡等问题,使得整个检索过程变得十分困难。在视频研究领域中,行人检测(PedestrianDetection)、行人重识别(PersonRe-ID)、目标跟踪(ObjectTracking)等任务受到研究者广泛关注,行人检索过程结合了行人检测和行人重识别两项任务。行人重识别旨在对查询行人与人工剪裁的候选行人框之间的相似度进行排序,其应用缺陷在于实际场景中不存在经过剪裁的候选行人框;行人检测旨在对给定的图片集或视频帧中的行人进行检测,找出行人在像素坐标下的位置信息;行人检索旨在根据查询行人找出给定图片集或视频中同一行人的位置信息,整个过程只需给出被查询行人图片和原始监控图片集,分别通过行人检测和行人重识别的方法来完成整个行人检索任务,能够有效的帮助 ...
【技术保护点】
1.一种基于区域匹配网络的行人检索方法,其特征在于,包括以下步骤:/n步骤1:对目标行人图片和原始图片集进行特征表示,其中原始图片集来源于自然拍摄且非处理过的图片,目标行人图片取自于原始图片集并标注有行人位置;/n步骤2:通过目标行人图片和原始图片集特征融合的方式将目标行人的特征结合到区域匹配网络中;/n步骤3:利用区域匹配网络的锚点框机制得出检索结果;/n步骤4:通过交替训练方式优化区域匹配网络的参数,使得最终产生更精确的行人检索结果。/n
【技术特征摘要】
1.一种基于区域匹配网络的行人检索方法,其特征在于,包括以下步骤:
步骤1:对目标行人图片和原始图片集进行特征表示,其中原始图片集来源于自然拍摄且非处理过的图片,目标行人图片取自于原始图片集并标注有行人位置;
步骤2:通过目标行人图片和原始图片集特征融合的方式将目标行人的特征结合到区域匹配网络中;
步骤3:利用区域匹配网络的锚点框机制得出检索结果;
步骤4:通过交替训练方式优化区域匹配网络的参数,使得最终产生更精确的行人检索结果。
2.根据权利要求1所述的基于区域匹配网络的行人检索方法,其特征在于:步骤1中,将目标行人图片和原始图片集图像输入到ResNet-50网络中,对图像进行特征提取。
3.根据权利要求1所述的基于区域匹配网络的行人检索方法,其特征在于:步骤2的具体实现包括以下子步骤:
步骤2.1:将目标行人提取的特征通过Roi-Pooling操作,得到池化后的特征向量;将行人框对应的特征图区域水平分为pooled_w×pooled_h的网格,最后对网格的每一份都进行最大池化处理即得到所需要的固定大小的输出,其中,pooled_w、pooled_h分别表示Roi池化后固定输出特征图的宽和高;
步骤2.2:假设输入的原始图片集图像大小为W×H,则通过ResNet-50后得到的张量;目标行人通过Roi-Pooling操作后得到1×C×1×1的张量,...
【专利技术属性】
技术研发人员:王中元,黄宝金,涂卫平,何政,
申请(专利权)人:武汉大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。