一种行人属性识别方法技术

技术编号:39803043 阅读:6 留言:0更新日期:2023-12-22 02:34
本申请涉及计算机视觉技术领域,尤其涉及一种行人属性识别方法

【技术实现步骤摘要】
一种行人属性识别方法、装置、电子设备及存储介质


[0001]本申请涉及计算机视觉
,尤其涉及一种行人属性识别方法

装置

电子设备及存储介质


技术介绍

[0002]行人属性识别是从给定的包含行人的输入图像中,利用计算机视觉算法自动识别出行人的属性信息,如性别

是否带眼镜

年龄

头发长短

是否背包

着装风格

上下身颜色等,对行人目标识别与行人图像检索有着重要的意义,广泛应用于公共安全

智慧城市

智慧交通

安防

工业等领域

[0003]相关技术下,随着深度学习技术的发展,越来越多的神经网络结构提出,并用于处理行人属性识别任务

目前用于处理行人属性识别任务的神经网络模型多是以经典卷积神经网络结构作为骨干模型,采用全局平均池化
(Global Average Poolilng

GAP)

AVGPooling
等网络结构构建的

实际使用中发现,在采用上述模型处理行人属性识别任务时,模型表现出的判别力欠佳,导致模型的属性识别准确率不稳定


技术实现思路

[0004]本申请实施例提供一种行人属性识别方法

装置

电子设备及存储介质,用以提高属性识别模型的判别力,提高属性识别的准确率

[0005]本申请实施例提供的具体技术方案如下:
[0006]第一方面,本申请实施例提供一种行人属性识别方法,包括:
[0007]对输入的包含目标对象的图像进行预处理,得到待识别图像;
[0008]将所述待识别图像输入属性识别模型,并基于所述属性识别模型,得到所述目标对象具有各参考属性的预测概率,其中,所述属性识别模型是基于卷积神经网络

目标注意力模块和分类器构建的,所述目标注意力模块是在双线性注意力神经网络结构中增加至少一个全局最大池化层后得到的;
[0009]基于所述各参考属性的预测概率,得到所述目标对象的属性识别结果

[0010]由于本申请实施例中的属性识别模型包括目标注意力模块,因此,相比于相关技术下的
GAP

AVGPooling
等网络结构,通过双线性注意力机制可以捕获图像中的二阶统计信息,从而可以使得属性识别模型获取到图像中局部近邻关系

[0011]加之,该目标注意力模块是在双线性注意力神经网络结构中增加至少一个全局最大池化层后得到的,而全局最大池化处理可以获取到每个通道特征图中的最大值,可以使得属性识别模型捕获到图像中的最相关元素,从而使得目标注意力模块可以获取到更为精细的特征,进而使得属性识别模型具有更优的判别力,在执行属性识别任务时,可以实现在稳定属性识别模型的属性识别准确率的前提下,提高了属性识别准确率

[0012]在一种可能的实现方式中,所述基于所述属性识别模型,得到所述目标对象具有各参考属性的预测概率,包括:
[0013]基于所述属性识别模型,对所述待识别图像依次经过多个映射模块进行映射处理

经过第一特征提取模块进行特征提取处理,以及经过所述分类器进行全局平均池化处理

全连接处理和归一化处理,得到所述目标对象具有各参考属性的预测概率,其中,所述多个映射模块中的任一映射模块是基于所述卷积神经网络和所述目标注意力模块构建的,所述第一特征提取模块是基于所述卷积神经网络构建的

[0014]上述方法,由于映射模块包括目标注意力模块,因此,可以使得属性识别模型获取更为精细的特征,从而使得属性识别模型的判别力更优,提高属性识别准确率

[0015]在一种可能的实现方式中,所述任一映射模块包括第二特征提取模块和所述目标注意力模块,所述第二特征提取模块是基于所述卷积神经网络构建的;
[0016]对所述待识别图像经过所述任一映射模块进行映射处理,包括:
[0017]利用所述第二特征提取模块,对目标图进行第一映射处理,得到目标特征图;
[0018]利用所述目标注意力模块,对所述目标特征图进行第二映射处理,得到所述任一映射模块输出的中间特征图;
[0019]其中,若所述任一映射模块是所述属性识别模型中的首个映射模块,则所述目标图为所述待识别图像,若所述任一映射模块不是首个映射模块,则所述目标图为与所述任一映射模块相邻的前一个映射模块输出的中间特征图

[0020]上述方法,通过目标注意力模块对输入的目标特征图进行第二映射处理的目的是对该目标特征图进行注意力调整,以获取更为精细的特征,从而使得属性识别模型的判别力更优,提高属性识别准确率

[0021]在一种可能的实现方式中,所述利用所述目标注意力模块,对所述目标特征图进行第二映射处理,得到所述任一映射模块输出的中间特征图,包括:
[0022]利用所述目标注意力模块,执行如下步骤:
[0023]对所述目标特征图进行降维处理和转换处理,得到第一特征图;
[0024]对所述第一特征图进行全局最大池化处理和卷积处理,得到第一中间注意力特征图,以及,对所述第一特征图进行卷积处理,得到第二特征图;
[0025]将所述第一中间注意力特征图和所述第二特征图进行融合,得到第二中间注意力特征图,并基于所述目标特征图和所述第二中间注意力特征图,得到目标注意力特征图;
[0026]对所述目标特征图和所述目标注意力特征图进行残差处理,得到所述任一映射模块输出的中间特征图

[0027]上述方法,通过全局最大池化处理

将第一中间注意力特征图和第二特征图进行融合,以及基于目标特征图和第二中间注意力特征图,得到目标注意力特征图,可以更好地对输入的目标特征图进行注意力调整;进一步地,在目标注意力模块中增加残差连接结构,可以充分利用获取到的细节信息,使得属性识别模型具有更优的判别力,从而提高模型的属性识别准确率

[0028]在一种可能的实现方式中,所述经过第一特征提取模块进行特征提取处理,包括:
[0029]利用所述第一特征提取模块,对经过所述属性识别模型中最后一个映射模块映射处理后的中间特征图进行特征提取处理

[0030]在一种可能的实现方式中,每个映射模块中的第一特征提取模块包括的卷积神经网络结构的数量,与所述第二特征提取模块包括的卷积神经网络结构的数量均相同;或
[0031]所述属性识别模型中的第一特征提取模块和所述第二特征提取模块包括的卷积神经网络结构的数量采用堆叠方式部署,其中,首个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种行人属性识别方法,其特征在于,包括:对输入的包含目标对象的图像进行预处理,得到待识别图像;将所述待识别图像输入属性识别模型,并基于所述属性识别模型,得到所述目标对象具有各参考属性的预测概率,其中,所述属性识别模型是基于卷积神经网络

目标注意力模块和分类器构建的,所述目标注意力模块是在双线性注意力神经网络结构中增加至少一个全局最大池化层后得到的;基于所述各参考属性的预测概率,得到所述目标对象的属性识别结果
。2.
如权利要求1所述的方法,其特征在于,所述基于所述属性识别模型,得到所述目标对象具有各参考属性的预测概率,包括:基于所述属性识别模型,对所述待识别图像依次经过多个映射模块进行映射处理

经过第一特征提取模块进行特征提取处理,以及经过所述分类器进行全局平均池化处理

全连接处理和归一化处理,得到所述目标对象具有各参考属性的预测概率,其中,所述多个映射模块中的任一映射模块是基于所述卷积神经网络和所述目标注意力模块构建的,所述第一特征提取模块是基于所述卷积神经网络构建的
。3.
如权利要求2所述的方法,其特征在于,所述任一映射模块包括第二特征提取模块和所述目标注意力模块,所述第二特征提取模块是基于所述卷积神经网络构建的;对所述待识别图像经过所述任一映射模块进行映射处理,包括:利用所述第二特征提取模块,对目标图进行第一映射处理,得到目标特征图;利用所述目标注意力模块,对所述目标特征图进行第二映射处理,得到所述任一映射模块输出的中间特征图;其中,若所述任一映射模块是所述属性识别模型中的首个映射模块,则所述目标图为所述待识别图像,若所述任一映射模块不是首个映射模块,则所述目标图为与所述任一映射模块相邻的前一个映射模块输出的中间特征图
。4.
如权利要求3所述的方法,其特征在于,所述利用所述目标注意力模块,对所述目标特征图进行第二映射处理,得到所述任一映射模块输出的中间特征图,包括:利用所述目标注意力模块,执行如下步骤:对所述目标特征图进行降维处理和转换处理,得到第一特征图;对所述第一特征图进行全局最大池化处理和卷积处理,得到第一中间注意力特征图,以及,对所述第一特征图进行卷积处理,得到第二特征图;将所述第一中...

【专利技术属性】
技术研发人员:张建安刘微曲磊
申请(专利权)人:海信集团控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1