【技术实现步骤摘要】
带双模态难挖掘三元-中心损失的行人重识别方法及系统
本申请涉及可视-红外行人重识别领域和深度学习
,特别是涉及带双模态难挖掘三元-中心损失的行人重识别方法及系统。
技术介绍
本部分的陈述仅仅是提到了与本申请相关的
技术介绍
,并不必然构成现有技术。行人重识别是跨不同的摄像机视点来检索目标行人,是计算机视觉社区的一个热门研究方向。它可以作为人脸识别技术的重要补充,并在视频监控系统中发挥重要作用。在过去的几年里,学者们对行人重识别的研究主要集中在可视领域,其中行人图像是由可视光相机拍摄的。但在现实生活中,当光线较暗时,可视光相机却无法捕捉到包含有效信息的行人图片。因此,能够在光线昏暗时捕捉有效行人图像的红外摄像机得到了广泛的应用。可视-红外行人重识别问题也就应运而生。可视-红外行人重识别就是根据给定的检索目标的可见光(红外)图像,从由红外(可视光)图像构成的画廊中搜索目标行人。它与可视-可视行人重识别最大的区别在于,本申请需要跨异质模态搜索行人图像。因为可见光摄像机和红外摄像机的反射光谱存在差异,所以捕获的可视图片和红外图片的信息容量和表示形式完全不同。此外,专利技术人还发现,不同数据集的红外模态图片也不尽相同。SYSU-MM01数据集包含近红外图像,它们具有相对清晰的轮廓并保留了一些细节信息。但RegDB数据集包含的是远红外图像,它们仅具有模糊的轮廓。此外,可视-红外行人重识别还遭受着传统的可视-可视行人重识别中存在的问题,例如摄像机视角变化,行人姿势变化和遮挡等,现有技术中对行人重识别的精准度有待提 ...
【技术保护点】
1.带双模态难挖掘三元-中心损失的行人重识别方法,其特征是,包括:/n将目标行人可视光图像和目标行人红外图像,输入到双路径基于局部的特征学习网络中,输出目标行人可视光图像的局部特征表示和目标行人红外图像的局部特征表示;同理,得到每个待查询行人的可视光图像的局部特征表示和红外图像的局部特征表示;/n将目标行人可视光图像的局部特征表示和目标行人红外图像的局部特征表示,投影到公共特征表示空间中,在公共特征表示空间中进行拼接处理,得到目标行人的最终特征描述符;同理,得到每个待查询行人的最终特征描述符;公共特征表示空间,使用带双模态难挖掘三元-中心损失函数进行优化;/n计算目标行人的最终特征描述符与每个待查询行人的最终特征描述符之间的欧式距离,将欧式距离小于设定阈值所对应的待查询行人图像作为行人重识别结果输出。/n
【技术特征摘要】
1.带双模态难挖掘三元-中心损失的行人重识别方法,其特征是,包括:
将目标行人可视光图像和目标行人红外图像,输入到双路径基于局部的特征学习网络中,输出目标行人可视光图像的局部特征表示和目标行人红外图像的局部特征表示;同理,得到每个待查询行人的可视光图像的局部特征表示和红外图像的局部特征表示;
将目标行人可视光图像的局部特征表示和目标行人红外图像的局部特征表示,投影到公共特征表示空间中,在公共特征表示空间中进行拼接处理,得到目标行人的最终特征描述符;同理,得到每个待查询行人的最终特征描述符;公共特征表示空间,使用带双模态难挖掘三元-中心损失函数进行优化;
计算目标行人的最终特征描述符与每个待查询行人的最终特征描述符之间的欧式距离,将欧式距离小于设定阈值所对应的待查询行人图像作为行人重识别结果输出。
2.如权利要求1所述的方法,其特征是,双路径基于局部的特征学习网络;网络结构包括:并列的可视光支路和红外支路;
所述可视光支路,采用第一改进的Resnet-50网络结构来实现;所述第一改进的Resnet-50网络结构后面依次连接第一平均池化层、第一全连接层和第一批归一化层;所述可视光支路的输入值为可视光图像,第一平均池化层输出可视光图像的局部特征;可视光图像的局部特征通过第一全连接层和第一批归一化层处理后,映射到公共特征表示空间中;
所述红外支路,也采用第二改进的Resnet-50网络结构来实现;所述第二改进的Resnet-50网络结构后面也依次连接第二平均池化层、第二全连接层和第二批归一化层;所述红外支路的输入值为红外图像,第二平均池化层输出红外图像的局部特征;红外图像的局部特征通过第二全连接层和第二批归一化层处理后,也映射到公共特征表示空间中;
公共特征表示空间将可视光图像的局部特征和红外图像的局部特征进行拼接,得到融合后的特征;
所述第一改进的Resnet-50网络结构,与所述第二改进的Resnet-50网络结构,是一样的;所述第一改进的Resnet-50网络结构,是指在Resnet-50网络结构的基础上,去掉最后一个平均池化层及其后续结构;
所述第一全连接层与第二全连接层是共享权重的。
3.如权利要求2所述的方法,其特征是,所述第一改进的Resnet-50网络结构,与所述第二改进的Resnet-50网络结构,均是预先训练好的网络结构。
4.如权利要求1或2所述的方法,其特征是,所述公共特征表示空间采用双模态难挖掘三元-中心损失函数和交叉熵损失函数来进行优化。
5.如权利要求4所述的方...
【专利技术属性】
技术研发人员:张化祥,蔡鑫,刘丽,朱磊,于治楼,
申请(专利权)人:山东师范大学,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。