【技术实现步骤摘要】
基于实例导向检测网络的行人搜索方法、系统、装置
本专利技术属于计算机视觉、模式识别领域,具体涉及一种基于实例导向检测网络的行人搜索方法、系统、装置。
技术介绍
行人搜索的目的是在场景图中定位与目标行人身份相同的行人。与行人再识别相比,该任务包含了行人检测部分,更加符合现实生活的需求,在安防监控、智能视频分析、人员搜救检索等领域具有广泛的应用。目前两阶段的行人搜索方法通常将其分为行人检测和行人再识别两个子任务,在行人检测阶段,现有的检测器从场景中检测所有人作为第二阶段的候选行人。然而对于行人再识别,随着候选行人数量的增加,干扰项也会增加,这会影响行人再识别阶段的准确率,从而影响整个任务的准确率,而这些问题在之前的研究中都尚未得到很好的解决。基于此,本专利技术提出了一种基于实例导向检测网络的行人搜索方法。
技术实现思路
为了解决现有技术中的上述问题,即为了解决现有的行人搜索方法搜索准确率较低的问题,本专利技术提出了一种基于实例导向检测网络的行人搜索方法,该方法包括:步骤S10,获取输入视频中第 ...
【技术保护点】
1.一种基于实例导向检测网络的行人搜索方法,其特征在于,该方法包括:/n步骤S10,获取输入视频中第t帧图像,作为第一图像;/n步骤S20,通过预训练的行人检测模型得到所述第一图像中各候选区域与第二图像的相似度并排序,排序后选取前N个候选区域作为检测区域;所述第二图像为预获取的待搜索行人目标的图像;/n步骤S30,基于各检测区域、所述第二图像,通过预训练的行人再识别模型得到行人目标的搜索结果;/n所述行人检测模型、所述行人再识别模型基于残差网络构建;其中,构建所述行人检测模型的残差网络为双通路残差网络。/n
【技术特征摘要】
1.一种基于实例导向检测网络的行人搜索方法,其特征在于,该方法包括:
步骤S10,获取输入视频中第t帧图像,作为第一图像;
步骤S20,通过预训练的行人检测模型得到所述第一图像中各候选区域与第二图像的相似度并排序,排序后选取前N个候选区域作为检测区域;所述第二图像为预获取的待搜索行人目标的图像;
步骤S30,基于各检测区域、所述第二图像,通过预训练的行人再识别模型得到行人目标的搜索结果;
所述行人检测模型、所述行人再识别模型基于残差网络构建;其中,构建所述行人检测模型的残差网络为双通路残差网络。
2.根据权利要求1所述的基于实例导向检测网络的行人搜索方法,其特征在于,所述行人检测模型其训练方法为:
步骤A10,获取训练样本,将待检测行人目标的图像作为第三图像、场景图作为第四图像;训练样本包括待检测行人目标的图像及场景图像;
步骤A20,通过双通路残差网络的conv1层至conv4层提取所述第三图像的特征作为第一特征、所述第四图像的特征作为第二特征;
步骤A30,基于所述第一特征,通过双通路残差网络的互相关层得到相关核;对所述第二特征,通过所述相关核、双通路残差网络的区域提案网络层得到行人目标的候选区域,并计算各候选区域与所述第三图像之间的损失,作为第一损失;
步骤A40,选取设定比例的正负样本的候选区域,并将选取的候选区域在所述第四图像对应的特征,作为第三特征;基于所述第三特征,通过双通路残差网络第二通路的conv5层及全局池化层,得到第四特征;基于所述第一特征,通过双通路残差网络第一通路的conv5层、全局池化层进行池化,得到第五特征;
步骤A50,基于所述第四特征、所述第五特征,通过双通路残差网络的全连接层得到各候选区域与所述行人目标相似度的关系特征,作为第六特征;
步骤A60,基于所述第六特征,通过局部关系模块得到加强的关系特征,作为第七特征;所述局部关系加强模块由全连接层和一个LN层组成;
步骤A70,基于所述第七特征,分别通过残差网络的回归分支、相似度分支、全局关系分支计算损失值,作为第二损失;基于所述第一损失、所述第二损失,对所述行人检测模型进行网络参数更新;
步骤A80,循环执行步骤A10-步骤A70,直至得到训练好的行人检测模型。
3.根据权利要求2所述的基于实例导向检测网络的行人搜索方法,其特征在于,所述训练样本分为自场景正样本、跨场景正样本、负样本三种类型;其中,所述自场景正样本包括一张行人目标图像、包含行人目标的场景图像,...
【专利技术属性】
技术研发人员:张兆翔,谭铁牛,宋纯锋,董文恺,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。