【技术实现步骤摘要】
一种基于双层显著特征的端到端行人搜索方法
[0001]本专利技术涉及计算机视觉
,具体地,涉及一种基于双层显著特征的端到端行人搜索方法。
技术介绍
[0002]行人搜索的目的是根据给定的目标行人图像,在相机拍摄的若干完整图像中识别并定位出该目标行人,这一问题通常划分为行人检测与行人重识别两个子任务:行人检测给出相机拍摄的完整图像中候选行人所在的区域,即行人边界框;行人重识别中对给定的目标行人图像和检测出的候选行人图像提取外观特征,由目标行人与候选行人的特征计算两者的相似度作为该候选行人是否为目标行人的依据。现有的行人搜索方法可以分为非端到端方法与端到端方法,非端到端方法使用独立的行人检测模型与行人重识别模型进行行人搜索,计算量大,运行效率低。端到端方法使用一个模型同时完成两个子任务,具有更高的计算效率。
[0003]现有的端到端行人搜索方法(Hierarchical online instance matching for person search.AAAI Conferenceon Artificial Intelligence,2020),(Norm
‑
aware embedding for efficientperson search.IEEE/CVF Conference on ComputerVision and Pattern Recognition,2020),(Anchor
‑
freeperson search.IEEE/CVF Conference ...
【技术保护点】
【技术特征摘要】
1.一种基于双层显著特征的端到端行人搜索方法,其特征在于,包括以下步骤:1)检测分支对输入图像进行行人检测,输出行人边界框以及分类分数,具体地,采用现有的Sparse R
‑
CNN模型对输入图像进行行人检测,输出N组检测结果,每组结果包含一个行人边界框以及所述边界框内行人的分类分数,N优选为300;2)ID分配模块为每个边界框分配其对应的行人身份ID,分配ID前去除行人检测分类分数小于M的结果,保留其余的边界框称为剩余边界框,并为所述剩余边界框分配其对应的行人身份ID;同时,ID分配模块将数据标注中的真实行人边界框加入剩余边界框内,并为每个真实行人边界框分配其在标注中对应的行人身份ID,M优选为0.2;3)ROI对齐对ID分配传递的每个边界框进行处理,所述边界框包含剩余边界框和真实行人边界框,具体地通过特征金字塔网络FPN的横向卷积输出全图多尺度特征,从所述全图多尺度特征上提取出多尺度的边界框内行人特征,将获得的多尺度的边界框内行人特征在通道维度进行拼接,最后通过一个3
×
3的卷积层进行多尺度特征融合获得ROI特征;4)重识别分支对ROI特征进行处理获得显著特征,所述显著特征以向量形式表现,然后通过实例层次和局部层次显著特征的优化使模型提取出有区分性的特征用于搜索目标行人。2.根据权利要求1所述的一种基于双层显著特征的端到端行人搜索方法,其特征在于,所述步骤2)中,ID分配具体包括以下步骤:2
‑
1)训练阶段,ID分配模块用于确定检测边界框中对应行人ID,并过滤掉低质量边界框,以防重识别分支中引入噪声样本进行训练,ID分配模块中ROI框为:ROI框对应的ID设置为:其中代表预测边框,代表分类分数,B={b1,b2,...,b
M
}代表图像中的地面真实行人边界框,P={p
b1
,p
b2
,...,p
bM
}代表对应的ID,q
conf
和q
iou
是预定义的置信度和交并比IOU阈值;2
‑
2)推理阶段,预测框直接用于提取人物特征并作为检测结果保存。3.根据权利要求2所述的一种基于双层显著特征的端到端行人搜索方法,其特征在于,所述步骤2
‑
1)中,在早期训练阶段只有很少的预测框可以通过ID分配模块,导致预测的边界框往往与真实值严重不符,降低了重识别的训练速度,为此,将训练数据标注的真实行人边界框和对应ID加入到ID分配中,以训练重识别分支。4.根据权...
【专利技术属性】
技术研发人员:百晓,张鹏程,郑锦,王晨,程姗,
申请(专利权)人:北京航空航天大学江西研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。