【技术实现步骤摘要】
一种基于部件权重生成网络的行人检索方法
本专利技术属于计算机视觉
,涉及一种监控视频的行人检索方法,具体涉及一种基于部件权重生成网络的行人检索方法。技术背景传统的视频检索技术侧重于查询特定场景下的特定某类对象,而在视频监控场景下,往往由于摄像头视角的影响,会造成光照变化、遮挡等问题,使得整个检索过程变得十分困难。视频研究领域中,行人检测(PedestrianDetection)、行人重识别(PersonRe-ID)、目标跟踪(ObjectTrack)等任务受到研究者广泛关注,行人检索过程结合了行人检测和行人重识别两项任务。行人重识别旨在对查询行人与人工剪裁的候选行人框之间的相似度进行排序,其应用的局限性在于实际场景中不存在经过剪裁的候选行人框;行人检测旨在对给定的图片集或视频帧中的行人进行检测,找出行人在像素坐标下的位置信息;行人检索旨在根据查询行人查找给定图片集或视频中同一行人的位置信息,整个过程只需给出被查询行人图片和原始监控图片集,分别通过行人检测和行人重识别的方法来完成整个行人检索任务。行人检索能够有效的帮 ...
【技术保护点】
1.一种基于部件权重生成网络的行人检索方法,其特征在于,包括以下步骤:/n步骤1:将原始图片集和目标行人图片通过DenseNet骨干网络和区域候选网络,提取出目标行人特征和候选行人特征,其中原始图片集来源于自然拍摄且非处理过的图片,目标行人图片取自于原始图片集并标注有行人的位置;/n步骤2:将目标行人特征和候选行人特征输入识别网络进一步获取识别特征,然后将得到的行人识别特征通过部件权重生成网络,获得行人匹配的部件权重,加权度量后得到行人检索结果;/n步骤3:采用余弦距离损失函数训练部件权重生成网络,采用改进的在线实例匹配损失函数训练整体的行人检索网络,其中行人检索网络表示整 ...
【技术特征摘要】
1.一种基于部件权重生成网络的行人检索方法,其特征在于,包括以下步骤:
步骤1:将原始图片集和目标行人图片通过DenseNet骨干网络和区域候选网络,提取出目标行人特征和候选行人特征,其中原始图片集来源于自然拍摄且非处理过的图片,目标行人图片取自于原始图片集并标注有行人的位置;
步骤2:将目标行人特征和候选行人特征输入识别网络进一步获取识别特征,然后将得到的行人识别特征通过部件权重生成网络,获得行人匹配的部件权重,加权度量后得到行人检索结果;
步骤3:采用余弦距离损失函数训练部件权重生成网络,采用改进的在线实例匹配损失函数训练整体的行人检索网络,其中行人检索网络表示整个端到端行人检索方法的全部网络,部件权重生成网络是其中的一部分并单独训练。
2.根据权利要求1所述的基于部件权重生成网络的行人检索方法,其特征在于,步骤1的具体实现是:
步骤1.1:将目标行人图片和原始图片集图像输入到DenseNet-121网络block1到block3层中,对图像进行特征提取;假设输入的原始图片集图像大小为W×H,则通过DenseNet-121网络block1到block3层后得到的特征图,其中N表示输入图片集大小,C表示特征提取后的图像通道数;
步骤1.2:将步骤1.1中获得的特征图通过一个3×3的卷积层,融合周围3×3的空间信息,生成张量为的特征图;
步骤1.3:将步骤1.2中获得的特征图一部分通过一个1×1的卷积层生成的得分张量,默认9个锚点框,即产生前景和背景总共18个得分;然后通过Reshape+Softmax+Reshape操作得到最终每个建议框的得分;另一部分通过一个1×1的卷积层生成的预测框张量,9个锚点框,每个锚点框包括(x,y,w,h),其中(x,y)代表建议框的左上角坐标,w,h代表建议框的宽和高,即得到36个位置信息;
步骤1.4:根据每个建议框的分数值并结合非极大抑制的方法提取出置信度高于阈值的候选框;
步骤1.5:最后利用ROI池化层从每个建议框的骨干特征映射到区域特征。
3.根据权利要求1所述的基于部件权重生成网络的行人检索方法,其特征在于,步骤2的具体实现是:
步骤2.1:将步骤1得到大小均为7×7×2048的目标行人特征图和候选行人特征图输入到DenseNet-121网络block4和block5层中,得到目标行人和候选行人的识别特征图,然后分别按照行数为(1、2、3),(3、4、5),(5、6、7)的3个部分池化层和一个全局池...
【专利技术属性】
技术研发人员:王中元,黄宝金,何政,梁超,
申请(专利权)人:武汉大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。