一种行人重识别模型的训练方法、识别方法、装置及设备制造方法及图纸

技术编号:33123615 阅读:72 留言:0更新日期:2022-04-17 00:29
本发明专利技术公开了一种行人重识别模型的训练方法、识别方法、装置及设备,本发明专利技术通过获取训练数据集,将训练数据集输入增强视觉感知学习网络模型,得到第一识别结果;特征提取模块对训练数据集进行特征提取生成第一特征图;注意力模块对第一特征图进行融合处理得到第二特征图,利用空间注意信息以及通道注意信息;批量注意模块对第二特征图进行融合增强处理得到第三特征图;增强视觉感知模块将第二特征图以及第三特征图进行特征融合处理,通过跨特征连接增强融合功能;识别模块对第四特征图进行识别得到第一识别结果,根据第一识别结果以及损失函数,修正增强视觉感知学习网络模型得到行人重识别模型,本发明专利技术可广泛应用于图像处理领域。领域。领域。

【技术实现步骤摘要】
一种行人重识别模型的训练方法、识别方法、装置及设备


[0001]本专利技术涉及图像处理领域,尤其是一种行人重识别模型的训练方法、识别方法、装置及设备。

技术介绍

[0002]随行人重识别(Person Re

identification,RE

ID)是计算机视觉中的一项具有挑战性的任务,其目标是通过匹配非重叠监控摄像头捕获的行人图像来识别同一个目标人物,它在广泛的监控应用中发挥着突出的作用,包括多摄像头活动分析,地铁视频监控系统,多摄像头跟踪和人群计数。随着我国智慧城市建设的大力开展,对于公共安全的要求也在不断增长,诸如火车站、道路、机场等一些公共区域中,都有规模庞大的视频监控网络覆盖,一方面,多样化和复杂的环境带来了挑战,因为照明、分辨率、人的姿势和光线条件可以在不分离的相机中大不相同,另一方面,不同行人的衣服高度相似,在试图识别目标人时也会造成相当大的困难,因此行人重识别面临技术困难。现有基于CNN的传统方法的视觉感知应用于行人重识别中,对整体特征和局部特征的处理是同质化的,对显著区域的重视不够,感知能力差,仅局限于挖掘粗糙的信息,同时现有的深度学习方法也未能以明确的方式增强注意知识的辨析性和丰富性。

技术实现思路

[0003]有鉴于此,为了解决上述技术问题中的至少之一,本专利技术的目的是提供一种行人重识别模型的训练方法、识别方法、装置及设备。
[0004]本专利技术实施例采用的技术方案是:
[0005]一种行人重识别模型的训练方法,包括:<br/>[0006]获取训练数据集;所述训练数据集包括不同摄像设备获取的且具有同一人物的行人图像;
[0007]将所述训练数据集输入增强视觉感知学习网络模型,得到第一识别结果;所述增强视觉感知学习网络模型包括特征提取模块、注意力模块、增强视觉感知模块以及识别模块;所述特征提取模块对所述训练数据集进行特征提取,生成第一特征图;所述注意力模块对所述第一特征图进行融合处理,得到包含空间注意信息以及通道注意信息的第二特征图;所述增强视觉感知模块包括批量注意模块,所述批量注意模块对所述第二特征图进行融合增强处理,得到第三特征图,所述增强视觉感知模块将所述第二特征图以及所述第三特征图进行特征融合处理,得到第四特征图;所述识别模块对所述第四特征图进行识别得到所述第一识别结果;
[0008]根据所述第一识别结果以及损失函数,对所述增强视觉感知学习网络模型进行修正,得到行人重识别模型。
[0009]进一步,所述注意力模块包括第一分支以及第二分支,所述注意力模块对所述第一特征图进行融合处理,得到包含空间注意信息以及通道注意信息的第二特征图,包括:
[0010]所述第一分支根据所述第一特征图通过通道注意力处理得到三维注意力图,所述第二分支对所述第一特征图进行卷积处理,得到基本特征图;
[0011]将所述三维注意力图以及所述基本特征图进行特征融合,得到第二特征图。
[0012]进一步,所述第一分支包括第一三维注意子模块以及第二三维注意子模块,所述第二分支包括第一残差块以及第二残差块;所述第一分支根据所述第一特征图通过通道注意力处理得到三维注意力图,所述第二分支对所述第一特征图进行卷积处理,得到基本特征图,包括:
[0013]所述第一三维注意子模块根据所述第一特征图通过第一通道注意力得到第一三维注意子图,所述第一残差块对所述第一特征图进行第一卷积操作,将所述第一三维注意子图以及第一卷积操作结果进行特征融合,得到特征融合图;
[0014]所述第二三维注意子模块根据所述特征融合图通过第二通道注意力得到三维注意力图,所述第二残差块对所述特征融合图进行第二卷积操作得到基本特征图;所述第一三维注意子模块以及所述第二三维注意子模块基于传递注意机制设置。
[0015]进一步,所述批量注意模块对所述第二特征图进行融合增强处理,得到第三特征图,包括:
[0016]根据所述第二特征图以及输入所述增强视觉感知学习网络模型的行人图像的样本数量,对所述第二特征图进行特征融合,并计算特征融合结果与所述样本数量的比值,得到特征融合后的特征映射;
[0017]通过增强机制对所述特征映射进行增强处理,得到第三特征图。
[0018]进一步,所述通过增强机制对所述特征映射进行增强处理,得到第三特征图,包括:
[0019]根据预设卷积核的空间维数、所述特征映射的通道数量以及过滤器的数量构建至少四维的多维度卷积滤波器;
[0020]通过所述多维度卷积滤波器对所述特征映射进行增强处理,得到第三特征图。
[0021]进一步,所述第四特征图包括至少两个第四特征子图,所述对所述第四特征图进行识别得到所述第一识别结果,包括:
[0022]分别对所述第四特征子图进行分类处理,得到第一分类结果和第二分类结果;
[0023]计算所述第一分类结果以及所述第二分类结果的余弦距离,得到判断结果;所述余弦距离的大小表征第一分类结果以及所述第二分类结果中的行人是否为同一人物;所述第一识别结果包括所述判断结果以及包括所述第一分类结果和所述第二分类结果中的至少之一。
[0024]本专利技术实施例还提供一种识别方法,包括:
[0025]获取待识别行人图像;
[0026]将所述待识别行人图像输入通过所述行人重识别模型的训练方法得到的行人重识别模型,得到第二识别结果。
[0027]本专利技术实施例还提供一种行人重识别模型的训练装置,包括:
[0028]获取模块,用于获取训练数据集;所述训练数据集包括不同摄像设备获取的且具有同一人物的行人图像;
[0029]识别模块,用于将所述训练数据集输入增强视觉感知学习网络模型,得到第一识
别结果;所述增强视觉感知学习网络模型包括特征提取模块、注意力模块、增强视觉感知模块以及识别模块;所述特征提取模块对所述训练数据集进行特征提取,生成第一特征图;所述注意力模块对所述第一特征图进行融合处理,得到包含空间注意信息以及通道注意信息的第二特征图;所述增强视觉感知模块包括批量注意模块,所述批量注意模块对所述第二特征图进行融合增强处理,得到第三特征图,所述增强视觉感知模块将所述第二特征图以及所述第三特征图进行特征融合处理,得到第四特征图;所述识别模块对所述第四特征图进行识别得到所述第一识别结果;
[0030]修正模块,用于根据所述第一识别结果以及损失函数,对所述增强视觉感知学习网络模型进行修正,得到行人重识别模型。
[0031]本专利技术实施例还提供一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现所述方法。
[0032]本专利技术实施例还提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种行人重识别模型的训练方法,其特征在于,包括:获取训练数据集;所述训练数据集包括不同摄像设备获取的且具有同一人物的行人图像;将所述训练数据集输入增强视觉感知学习网络模型,得到第一识别结果;所述增强视觉感知学习网络模型包括特征提取模块、注意力模块、增强视觉感知模块以及识别模块;所述特征提取模块对所述训练数据集进行特征提取,生成第一特征图;所述注意力模块对所述第一特征图进行融合处理,得到包含空间注意信息以及通道注意信息的第二特征图;所述增强视觉感知模块包括批量注意模块,所述批量注意模块对所述第二特征图进行融合增强处理,得到第三特征图,所述增强视觉感知模块将所述第二特征图以及所述第三特征图进行特征融合处理,得到第四特征图;所述识别模块对所述第四特征图进行识别得到所述第一识别结果;根据所述第一识别结果以及损失函数,对所述增强视觉感知学习网络模型进行修正,得到行人重识别模型。2.根据权利要求1所述行人重识别模型的训练方法,其特征在于:所述注意力模块包括第一分支以及第二分支,所述注意力模块对所述第一特征图进行融合处理,得到包含空间注意信息以及通道注意信息的第二特征图,包括:所述第一分支根据所述第一特征图通过通道注意力处理得到三维注意力图,所述第二分支对所述第一特征图进行卷积处理,得到基本特征图;将所述三维注意力图以及所述基本特征图进行特征融合,得到第二特征图。3.根据权利要求2所述行人重识别模型的训练方法,其特征在于:所述第一分支包括第一三维注意子模块以及第二三维注意子模块,所述第二分支包括第一残差块以及第二残差块;所述第一分支根据所述第一特征图通过通道注意力处理得到三维注意力图,所述第二分支对所述第一特征图进行卷积处理,得到基本特征图,包括:所述第一三维注意子模块根据所述第一特征图通过第一通道注意力得到第一三维注意子图,所述第一残差块对所述第一特征图进行第一卷积操作,将所述第一三维注意子图以及第一卷积操作结果进行特征融合,得到特征融合图;所述第二三维注意子模块根据所述特征融合图通过第二通道注意力得到三维注意力图,所述第二残差块对所述特征融合图进行第二卷积操作得到基本特征图;所述第一三维注意子模块以及所述第二三维注意子模块基于传递注意机制设置。4.根据权利要求1

3任一项所述行人重识别模型的训练方法,其特征在于:所述批量注意模块对所述第二特征图进行融合增强处理,得到第三特征图,包括:根据所述第二特征图以及输入所述增强视觉感知学习网络模型的行人图像的样本数量,对所述第二特征图进行特征融合,并计算特征融合结果与所述样本数量的比值,得到特征融合后的特征映射;通过增强机制对所述特征映射进行增强处理,得到第三特征图。5.根据权利要求4所述...

【专利技术属性】
技术研发人员:黄业文许智聪单纯
申请(专利权)人:广东技术师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1