行人重识别方法、系统、可读存储介质及计算机设备技术方案

技术编号:38348775 阅读:10 留言:0更新日期:2023-08-02 09:28
本发明专利技术提出行人重识别方法、系统、可读存储介质及计算机设备,该方法包括:对历史行人图像进行特征提取;沿着水平坐标和垂直坐标分别对特征张量进行编码,并将水平特征和垂直特征进行级联转换,并根据在水平方向和在垂直方向上的中间特征图获取注意力特征图;根据注意力特征图获取池化核域中每个激活值所对应的激活权重,以根据激活权重对池化核域内所有激活值的加权求和;将加权求和值编码映射到欧式空间,以计算出样本的类中心,并根据样本的类中心计算出类中心三元组损失,并根据类中心三元组损失迭代训练出行人重识别模型。本发明专利技术能够传统技术行人重识别准确率较低的问题。够传统技术行人重识别准确率较低的问题。够传统技术行人重识别准确率较低的问题。

【技术实现步骤摘要】
行人重识别方法、系统、可读存储介质及计算机设备


[0001]本专利技术涉及图像识别
,特别涉及一种行人重识别方法、系统、可读存储介质及计算机设备。

技术介绍

[0002]近年来,随着智能安防和视频监控领域的需求与日俱增,行人重识别(ReID)受到了越来越多研究学者的关注和研究。行人重识别可以看成一个图像检索任务,利用计算机视觉技术判断给定的图像或视频序列中是否存在特定行人,即给定一张待识别的行人图像,在其它摄像头拍摄到的视频中检索出与待识别行人具有相同身份的行人图像。其在计算机视觉领域的行人追踪、智能监控等方面具有重要作用。
[0003]随着深度学习的不断发展,在计算机视觉领域更深层的网络被应用到行人重识别任务中,优化了识别效果。但随着更深层网络的提出,底层细节信息随着卷积层的加深往往会丢失,同时,受背景冗余、颜色、亮度、摄像头拍摄角度、运动模糊和检测误差等问题的影响,使得行人图像间的差异很大,不易区分,最终导致行人重识别准确率低下。

技术实现思路

[0004]基于此,本专利技术的目的是提出一种行人重识别方法、系统、可读存储介质及计算机设备,以解决传统技术行人重识别准确率较低的问题。
[0005]根据本专利技术提出的一种行人重识别方法,所述方法包括:获取历史行人图像,并对所述历史行人图像进行特征提取,得到与每份所述历史行人图像分别对应的特征张量;沿着水平坐标和垂直坐标分别对所述特征张量进行编码,得到水平特征和垂直特征,并将所述水平特征和所述垂直特征进行级联转换,以得到在水平方向和在垂直方向上的中间特征图,并根据在水平方向和在垂直方向上的中间特征图获取注意力特征图;根据所述注意力特征图获取池化核域中每个激活值所对应的激活权重,以根据所述激活权重对池化核域内所有激活值的加权求和,得到输出值;将所述输出值编码映射到欧式空间,以计算出样本的类中心,并根据样本的类中心计算出类中心三元组损失,并根据所述类中心三元组损失迭代训练出行人重识别模型;将待识别的行人图像输入到所述行人重识别模型,以通过所述类中心三元组损失对待识别的行人图像进行聚类表示,得到最终的识别结果。
[0006]综上,根据上述的行人重识别方法,通过提取不因图像颜色、亮度和角度等外观变化而变化的行人特征,然后对提取的行人特征做出了更进一步的研究,第一,在模型骨干网络不同的网络层嵌入坐标注意力模块(CA),抑制图像中无关的特征,增强具有判别力的特征;第二,将骨干网络最后的平均池化替换为软池化(SoftPool),减少特征丢失,保留更多的细粒度特征。另外,在模型训练阶段,通过对现有的三元组损失进行了改进,通过将同一
类的行人特征使用类中心表示,来增强三元组损失在训练过程中的鲁棒性,从而得到行人重识别准确率较高的行人重识别模型,以克服传统技术因行人图像差异很大、不易区分等原因而导致的行人重识别准确率较低的问题。
[0007]在本专利技术较佳实施例中,所述获取历史行人图像,并对所述历史行人图像进行特征提取,得到与每份所述历史行人图像分别对应的特征张量的步骤包括:对输入的行人图像进行预处理,并将预处理得到的输出张量以特征通道所在维度进行划分,将一半的行人特征图进行IN计算,另一半行人的特征图进行BN计算,以分别得到特征和特征,其中,R表示实数集,表示张量的特征通道数,表示张量的高度,表示张量的宽度;将得到的特征和特征经过ReLU激活函数计算和卷积操作,得到特征张量,其中分别表示第一张、第二张、第c张行人图像对应的特征张量。
[0008]在本专利技术较佳实施例中,所述沿着水平坐标和垂直坐标分别对所述特征张量进行编码,得到水平特征和垂直特征的步骤包括:输入特征张量,分别使用尺寸为和的卷积核沿着水平坐标和垂直坐标对特征图的每一个通道进行编码,其中高度为的通道输出表示为:其中,表示与特征张量对应的水平特征;宽度为的通道输出表示为:其中,表示与特征张量对应的垂直特征;所述将所述水平特征和所述垂直特征进行级联转换,以得到在水平方向和在垂直方向上的中间特征图的步骤包括:根据以下公式获取中间特征图:其中,表示卷积变换操作,(
·
)表示激活函数,表示中间特征图,f包括在水平方向上的中间特征图和在垂直方向上的中间特征图;所述根据在水平方向和在垂直方向上的中间特征图获取注意力特征图的步骤包括:
根据以下公式分别对在水平方向上的中间特征图和在垂直方向上的中间特征图进行激活操作:进行激活操作:其中,和均表示卷积变换操作,表示在水平方向上经过卷积变换后的中间特征图,表示在垂直方向上经过卷积变换后的中间特征图;根据以下公式获取注意力特征图:其中,表示注意力特征图。
[0009]在本专利技术较佳实施例中,所述根据所述注意力特征图获取池化核域中每个激活值所对应的激活权重,以根据所述激活权重对池化核域内所有激活值的加权求和,得到输出值的步骤包括:根据以下公式获取激活权重:其中,表示池化核域的第i个激活区域对应的激活权重,y
ci
表示注意力特征图y
c
的池化核域中的第i个激活值,y
cj
表示注意力特征图y
c
的池化核域中的第j个激活值;根据以下公式计算得到加权求和:。
[0010]在本专利技术较佳实施例中,所述将所述输出值编码映射到欧式空间,以计算出样本的类中心,并根据样本的类中心计算出类中心三元组损失,并根据所述类中心三元组损失迭代训练出行人重识别模型的步骤包括:根据以下公式计算得到样本的类中心:其中,表示第类样本的类中心,表示批量中第类的一组样本,分别表示第1个、第i个、第N个样本,f(
·
)表示将样本编码映射到欧式空间;根据以下公式计算得到类中心三元组损失:其中,L表示类中心三元组损失,分别表示第个三元组的正、负样本类中心,表示锚样本与正样本类中心之间的欧氏度量距离;
表示锚样本与负样本类中心之间的欧式度量距离,表示阈值参数,[]为ReLU激活函数。
[0011]在本专利技术较佳实施例中,所述将一半的行人特征图进行IN计算的步骤包括:根据以下公式计算得到特征:其中,和表示经过训练得到的两个可参变量,和表示对每一个行人图像的每个特征通道计算得到的均值和标准差,表示输入张量在第个样本的第个通道高度、宽度处对应的像素值,表示常量。
[0012]在本专利技术较佳实施例中,所述另一半行人的特征图进行BN计算的步骤包括:根据以下公式计算得到特征:其中,和表示对当前批次的所有行人图像的每个特征通道计算得到的均值和标准差。
[0013]本专利技术另一方面还提供行人重识别系统,所述系统包括:特征张量提取模块,用于获取历史行人图像,并对所述历史行人图像进行特征提取,得到与每份所述历史行人图像分别对应的特征张量;注意力特征获取模块,用于沿着水平坐标和垂直坐标分别对所述特征张量进行编码,得到水平特征和垂直特征,并将所述水平特征和所述垂直特征进行级联转换,以得到在水平方向和在垂直方向上的中间特征图,并根据在水平方向和在垂直方向上的中间特征图获取注意力特征图;加权求和获取模块本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种行人重识别方法,其特征在于,所述方法包括:获取历史行人图像,并对所述历史行人图像进行特征提取,得到与每份所述历史行人图像分别对应的特征张量;沿着水平坐标和垂直坐标分别对所述特征张量进行编码,得到水平特征和垂直特征,并将所述水平特征和所述垂直特征进行级联转换,以得到在水平方向和在垂直方向上的中间特征图,并根据在水平方向和在垂直方向上的中间特征图获取注意力特征图;根据所述注意力特征图获取池化核域中每个激活值所对应的激活权重,以根据所述激活权重对池化核域内所有激活值的加权求和,得到输出值;将所述输出值编码映射到欧式空间,以计算出样本的类中心,并根据样本的类中心计算出类中心三元组损失,并根据所述类中心三元组损失迭代训练出行人重识别模型;将待识别的行人图像输入到所述行人重识别模型,以通过所述类中心三元组损失对待识别的行人图像进行聚类表示,得到最终的识别结果。2.根据权利要求1所述的行人重识别方法,其特征在于,所述获取历史行人图像,并对所述历史行人图像进行特征提取,得到与每份所述历史行人图像分别对应的特征张量的步骤包括:对输入的行人图像进行预处理,并将预处理得到的输出张量以特征通道所在维度进行划分,将一半的行人特征图进行IN计算,另一半行人的特征图进行BN计算,以分别得到特征和特征,其中,R表示实数集,表示张量的高度,表示张量的宽度,N为输出张量x1×1的批次大小;将得到的特征和特征经过ReLU激活函数计算和卷积操作,得到特征张量,其中分别表示第一张、第二张、第c张行人图像对应的特征张量,表示张量的特征通道数。3.根据权利要求2所述的行人重识别方法,其特征在于,所述沿着水平坐标和垂直坐标分别对所述特征张量进行编码,得到水平特征和垂直特征的步骤包括:输入特征张量,分别使用尺寸为和的卷积核沿着水平坐标和垂直坐标对特征图的每一个通道进行编码,其中高度为的通道输出表示为:其中,表示与特征张量对应的水平特征;宽度为的通道输出表示为:其中,表示与特征张量对应的垂直特征;所述将所述水平特征和所述垂直特征进行级联转换,以得到在水平方向和在垂直方向
上的中间特征图的步骤包括:根据以下公式获取中间特征图:其中,表示卷积变换操作,(
·
)表示激活函数,表示中间特征图,f包括在水平方向上的中间特征图和在垂直方向上的中间特征图;所述根据在水平方向和在垂直方向上的中间特征图获取注意力特征图的步骤包括:根据以下公式分别对在水平方向上的中间特征图和在垂直方向上的中间特征图进行激活操作:进行激活操作:其中,和均表示卷积变换操作,表示在水平方向上经过卷积变换后的中间特征图,表示在垂直方向上经过卷积变换后的中间特征图;根据以下公式获取注意力特征图:其中,表示注意力特征图。4.根据权利要求3所述的行人重识别方法,其特征在于,所述根据所述注意力特征图获取池化核域中每个激活值所对应的激活权重,以根据所述激活权重对池化核域内所有激活值的加权求和,得到输出值的步骤包括:根据以下公式获取激活权重:其中,表示池化核域的第i个激活区域对应的激活权重,y
ci
表示注意力特征图y

【专利技术属性】
技术研发人员:涂宏斌胡剑文罗会源彭圆圆徐任玉高晨李启翔章翔
申请(专利权)人:华东交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1