行人再识别方法及装置、计算机设备及可读介质制造方法及图纸

技术编号:21971920 阅读:26 留言:0更新日期:2019-08-28 01:34
本发明专利技术提供一种行人再识别方法及装置、计算机设备及可读介质。其方法包括:采集包括有行人图像的目标图像和待识别图像;基于预先训练的特征提取模型,分别获取所述目标图像的特征表达和所述待识别图像的特征表达;其中所述特征提取模型基于基准图像的自注意力特征和基准图像相对于参考图像的协同注意力特征共同训练得到;根据所述目标图像的特征表达和所述待识别图像的特征表达,识别所述待识别图像中的行人是否与所述目标图像中的行人为同一行人。本发明专利技术的行人再识别方案,采用上述特征提取模型进行行人再识别时,能够有效地提高行人再识别的准确性。

Pedestrian Recognition Method and Device, Computer Equipment and Readable Media

【技术实现步骤摘要】
行人再识别方法及装置、计算机设备及可读介质
本专利技术涉及计算机应用
,尤其涉及一种行人再识别方法及装置、计算机设备及可读介质。
技术介绍
跨摄像头条件下的行人再识别是人体跟踪、安防监控等领域的一项重要内容。目前,行人再识别技术有很多种实现方案,例如,对于某个摄像头拍摄的目标图像中的行人,可以由人工来监控其他摄像头拍摄的图像中是否包括该行人,从而实现行人再识别。但是这种人工监控的压力很大,且主观性较强,准确性较差。为了克服人工监控的缺陷,现有技术中还提出了一种基于人体全局特征进行行人再识别。其中基于人体全局特征的行人再识别方法,通过设计复杂的深度分类神经网络来提取行人图片的全局特征,或是通过度量学习方法在特征空间中将相同身份的行人图片拉近,将不同身份的行人图片推远来进行全局特征的学习。但是,现有的基于人体全局特征进行行人再识别的技术方案,在处理整体外观较为相似的不同身份的行人时容易出现识别错误,导致现有的行人再识别方案的准确性较低。
技术实现思路
本专利技术提供了一种行人再识别方法及装置、计算机设备及可读介质,用于提高行人再识别的准确性。本专利技术提供一种行人再识别方法,所述方法包括:采集包括有行人图像的目标图像和待识别图像;基于预先训练的特征提取模型,分别获取所述目标图像的特征表达和所述待识别图像的特征表达;其中所述特征提取模型基于基准图像的自注意力特征和基准图像相对于参考图像的协同注意力特征共同训练得到;根据所述目标图像的特征表达和所述待识别图像的特征表达,识别所述待识别图像中的行人是否与所述目标图像中的行人为同一行人。本专利技术还提供一种行人再识别装置,所述装置包括:采集模块,用于采集包括有行人图像的目标图像和待识别图像;提取模块,用于基于预先训练的特征提取模型,分别获取所述目标图像的特征表达和所述待识别图像的特征表达;其中所述特征提取模型基于基准图像的自注意力特征和基准图像相对于参考图像的协同注意力特征共同训练得到;识别模块,用于根据所述目标图像的特征表达和所述待识别图像的特征表达,识别所述待识别图像中的行人是否与所述目标图像中的行人为同一行人。本专利技术还提供一种计算机设备,所述设备包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的行人再识别方法。本专利技术还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的行人再识别方法。本专利技术的行人再识别方法及装置、计算机设备及可读介质,通过采用上述基于基准图像的自注意力特征和基准图像相对于参考图像的协同注意力特征共同训练得到的特征提取模型,来实现行人再识别,该特征提取模型不仅能够提取到图像自身的细节特征,同时还能够提取到该张图像区别于其他图像的特征,保证该特征提取模型提取的特征表达中包括图像的更多细节信息,且更具有区分性。因此,采用本专利技术的特征提取模型进行行人再识别时,能够有效地提高行人再识别的准确性。【附图说明】图1为本专利技术的行人再识别方法实施例一的流程图。图2为本专利技术的行人再识别方法实施例二的流程图。图3为本专利技术提供的特征提取模型的训练原理示意图。图4为本专利技术的行人再识别装置实施例一的结构图。图5为本专利技术的行人再识别装置实施例二的结构图。图6为本专利技术的行人再识别装置实施例三的结构图。图7为本专利技术的计算机设备实施例的结构图。图8为本专利技术提供的一种计算机设备的示例图。【具体实施方式】为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。人工智能(ArtificialIntelligence;AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专利技术采用AI领域中的神经网络模型为原型,基于基准图像的自注意力特征和基准图像相对于参考图像的协同注意力特征,共同训练得到一种特征提取模型,使得该特征提取模型融合更多细节信息、更具区分性,从而基于该特征提取模型进行行人再识别时,可以大幅提升行人再识别的性能。图1为本专利技术的行人再识别方法实施例一的流程图。如图1所示,本实施例的行人再识别方法,具体可以包括如下步骤:S100、采集包括有行人图像的目标图像和待识别图像;本实施例的行人再识别方法的执行主体为一行人再识别装置,该行人再识别装置可以为一独立的电子实体,或者也可以为采用软件集成的应用,使用时运行在计算机设备上,以实现行人再识别。本实施例的行人再识别方法,应用于跨摄像头的场景中,例如,在一个人流量较大的公共场合下,可以采集其中一个摄像头采集的图像,作为目标图像。然后采集其他摄像头采集的图像,作为待识别图像。其中目标图像和待识别图像中都包含有行人图像。本实施例的行人再识别就是检测待识别图像中的行人是否与目标图像中的行人为同一行人。本实施例中,基于同一目标图像,可以采集多个不同摄像头分别采集到的多张待识别图像,依次按照本实施例的技术方案,对每张待识别图像进行行人再识别。S101、基于预先训练的特征提取模型,分别获取目标图像的特征表达和待识别图像的特征表达;其中特征提取模型基于基准图像的自注意力特征和基准图像相对于参考图像的协同注意力特征共同训练得到;本实施例中所采用的特征提取模型,用于从目标图像或者待识别图像中提取能够表征对应图像的特征表达。且本实施例的特征提取模型是基于基准图像的自注意力特征和基准图像相对于参考图像的协同注意力特征共同训练得到,这样,由于自注意力特征可以表示基准图像中最具有身份代表性的细节特征,在基准图像中,该注意力特征较为显著;而协同注意力特征可以表示基准图像中不同于参考图像中比较相似的区域的特征,该特征使得基准图像相比较参考图像,具有一定的区分能力,从而可以使得训练后的特征提取模型在对图像进行特征表达提取时,不仅能够提取到图像自身的细节特征,同时还能够提取到该张图像区别于其他图像的特征,保证该特征提取模型提取的全局特征表达中包括图像的更多细节信息,且更具有区分性,进而能够提高行人再识别时的准确性。S102、根据目标图像的特征表达和待识别图像的特征表达,识别各张待识别图像中的行人是否与目标图像中的行人为同一行人。本实施例中的特征提取模型,在使用时输出的特征表达可以包括不同形式的特征表达。例如,若使用时输出的是基础特征表达,该基础特征表达可以为一个3维矩阵,此时根据目标图像的基础特征表达和待识别图像的基础特征表达,识别各张待识别图像中的行人是否与目标图像中的行人为同一行人之前,需要分别对目标图像的基础特征表达和待识别图像的基础特征表达进行全局池化操作,得到目标图像的全局特征表达和待识别图像的全局特征表达。而全局特征表达为一维向量,此时可以参考向量的相似度计算方式,计算目标图像的全局特征表达与待识别图像的全局特征表达的相似度;判断相似度是否大于预设相似度阈值,若是,确定对应的待识别图像中的行人与目标图像中的行人为同一行人;否则不是同一人。本实施例的特征提取模型为一种深度神经本文档来自技高网...

【技术保护点】
1.一种行人再识别方法,其特征在于,所述方法包括:采集包括有行人图像的目标图像和待识别图像;基于预先训练的特征提取模型,分别获取所述目标图像的特征表达和所述待识别图像的特征表达;其中所述特征提取模型基于基准图像的自注意力特征和基准图像相对于参考图像的协同注意力特征共同训练得到;根据所述目标图像的特征表达和所述待识别图像的特征表达,识别所述待识别图像中的行人是否与所述目标图像中的行人为同一行人。

【技术特征摘要】
1.一种行人再识别方法,其特征在于,所述方法包括:采集包括有行人图像的目标图像和待识别图像;基于预先训练的特征提取模型,分别获取所述目标图像的特征表达和所述待识别图像的特征表达;其中所述特征提取模型基于基准图像的自注意力特征和基准图像相对于参考图像的协同注意力特征共同训练得到;根据所述目标图像的特征表达和所述待识别图像的特征表达,识别所述待识别图像中的行人是否与所述目标图像中的行人为同一行人。2.根据权利要求1所述的方法,其特征在于,根据所述目标图像的特征表达和所述待识别图像的特征表达,识别所述待识别图像中的行人是否与所述目标图像中的行人为同一行人,包括:若所述特征表达为全局特征表达,计算所述目标图像的全局特征表达与所述待识别图像的全局特征表达的相似度;判断所述相似度是否大于预设相似度阈值,若是,确定对应的所述待识别图像中的行人与所述目标图像中的行人为同一行人。3.根据权利要求2所述的方法,其特征在于,若所述特征表达为基础特征表达,计算所述目标图像的全局特征表达与所述待识别图像的全局特征表达的相似度之前,所述方法还包括:分别将所述目标图像的基础特征表达和所述待识别图像的基础特征表达进行全局池化操作,得到所述目标图像的全局特征表达和所述待识别图像的全局特征表达。4.根据权利要求1所述的方法,其特征在于,基于预先训练的特征提取模型,分别获取所述目标图像的特征表达和所述待识别图像的特征表达之前,所述方法还包括:采集数张训练图像以及每张所述训练图像中包括的行人的已知标识,一起构成训练图像集;根据所述训练图像集,生成数组训练数据,每组所述训练数据中包括一张基准图像和至少一张参考图像;采用各组所述训练数据和各组所述训练数据中所述基准图像中所包括的行人的已知标识,训练所述特征提取模型。5.根据权利要求4所述的方法,其特征在于,采用各组所述训练数据和各组所述训练数据中所述基准图像中所包括的行人的已知标识,训练所述特征提取模型,包括:对于各组所述训练数据,基于对应的所述训练数据中的所述基准图像的自注意力特征,训练所述特征提取模型;基于对应的所述训练数据中的所述基准图像相对于各张所述参考图像的协同注意力特征,训练所述特征提取模型。6.根据权利要求5所述的方法,其特征在于,对于各组所述训练数据,基于对应的所述训练数据中的所述基准图像的自注意力特征,训练所述特征提取模型,包括:对于各组所述训练数据,将对应的所述训练数据中的所述基准图像输入至所述特征提取模型中,获取所述特征提取模型输出的所述基准图像的基础特征表达以及检索表达,其中所述基准图像的检索表达为对所述基准图像的基础特征表达进行全局池化操作得到的全局特征表达,再进行特征变换而得到;从所述基准图像的基础特征表达中获取符合所述基准图像的检索表达的特征,作为所述基准图像的自注意力特征;将所述基准图像的自注意力特征输入至第一身份识别器中,由所述第一身份识别器根据所述基准图像的自注意力特征预测所述基准图像中的行人的第一预测标识;检测所述第一预测标识和所述已知标识是否一致,若不一致,调整所述特征提取模型和所述第一身份识别器的参数,使得所述第一预测标识与所述已知标识趋于一致。7.根据权利要求6所述的方法,其特征在于,基于对应的所述训练数据中的所述基准图像相对于各张所述参考图像的协同注意力特征,训练所述特征提取模型,包括:对于各组所述训练数据中的各张所述参考图像,将所述参考图像输入至所述特征提取模型中,获取所述特征提取模型输出的所述参考图像的检索表达;从对应的所述基准图像的基础特征表达中获取符合所述参考图像的检索表达的特征,作为所述基准图像相对于所述参考图像的协同注意力特征;将所述协同注意力特征输入至第二身份识别器中,由所述第二身份识别器根据所述协同注意力特征预测所述基准图像中的行人的第二预测标识;检测所述第二预测标识和所述已知标识是否一致,若不一致,调整所述特征提取模型和所述第二身份识别器的参数,使得所述第二预测标识与所述已知标识趋于一致。8.根据权利要求6所述的方法,其特征在于,采用各组所述训练数据和各所述训练数据中所述基准图像中所包括的行人的已知标识,训练所述特征提取模型,还包括如下至少一种:对于各组所述训练数据,将所述训练数据中的所述基准图像的检索表达输入至第三身份识别器中,由所述第三身份识别器根据所述基准图像的检索表达预测所述基准图像中的行人的第三预测标识;检测所述第三预测标识和所述已知标识是否一致,若不一致,调整所述特征提取模型和所述第三身份识别器的参数,使得所述第三预测标识与所述已知标识趋于一致;和对所述基准图像的基础特征表达进行全局池化操作,得到全局特征表达,将所述全局特征表达输入至第四身份识别器中,由所述第四身份识别器根据所述全局特征表达预测所述基准图像中的行人的第四预测标识;检测所述第四预测标识和所述已知标识是否一致,若不一致,调整所述特征提取模型和所述第四身份识别器的参数,使得所述第四预测标识与所述...

【专利技术属性】
技术研发人员:王之港王健文石磊丁二锐孙昊
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1