基于属性特征学习解耦的行人属性识别方法及系统技术方案

技术编号:32818646 阅读:19 留言:0更新日期:2022-03-26 20:15
本发明专利技术属于模式识别、计算机视觉、视觉场景分析及多标签分类领域,具体涉及了一种基于属性特征学习解耦的行人属性识别方法及系统,旨在解决有技术采用相同的特征分类不同的属性,从而行人属性识别的有效性低、鲁棒性不强的问题。本发明专利技术包括:通过基于深度神经网络构建的特征提取模型,并提取待识别预处理图像的卷积图像特征;预设可学习参数并获取每个类别属性的属性索引特征;通过语义空间互注意力模块提取属性特征和索引注意力图;以前一个语义空间互注意力模块的输出作为当前模块的输入进行迭代;通过属性分类器进行迭代获得的最终的待识别图像属性特征的分类。本发明专利技术可应用于各场景的行人图片属性识别,并能显著提高行人图片属性识别的性能。图片属性识别的性能。图片属性识别的性能。

【技术实现步骤摘要】
基于属性特征学习解耦的行人属性识别方法及系统


[0001]本专利技术属于模式识别、计算机视觉、视觉场景分析及多标签分类领域,具体涉及了一种基于属性特征学习解耦的行人属性识别方法及系统。

技术介绍

[0002]近年来,计算机视觉、人工智能、机器感知等领域迅猛发展。随着安防摄像头的广泛部署,如何在监控场景中进行高效的行人属性识别得到广泛的关注。监控场景中的行人属性识别就是利用计算机算法对视频中的行人图片进行处理分析,自动地得到某一行人所包含的属性类别,比如年龄,性别,背包,衣着等等。从而为下游的行人图片检索和行人重识别技术提供支撑和辅助。
[0003]传统算法通过构建手工设计的图片特征来得到行人图片的特征表达,但是其性能不足以满足实际场景中的应用需求。而近年来随着深度学习的广泛使用,许多行人属性算法从更好的特征表达以及属性关系建模两个方面出发,不断提高监控场景中的行人属性识别方法,推动着行人属性识别领域的发展。
[0004]然而,尽管之前有大量的工作通过学习更有判别能力的视觉特征表达以及更好的建模属性之间的关系,使得行人属性识别的性能有了显著的提升,但是各个方法都使用一个特征对多个不同属性进行分类。这些方法无法应用于各个场景中的行人图片的属性识别,行人图片属性识别的性能尚达不到要求。
[0005]总的来说,本领域还急需一种不依赖于场景中行人属性的先验分布,为不同的属性提取不同的特征,用于对应的属性的预测和判别的方法,从而有效提高行人属性识别的有效性和鲁棒性。

技术实现思路

[0006]为了解决现有技术中的上述问题,即现有技术采用相同的特征分类不同的属性,从而行人属性识别的有效性低、鲁棒性不强的问题,本专利技术提供了一种基于属性特征学习解耦的行人属性识别方法,该方法包括:步骤S10,通过图像缩放和补零填充操作将待识别图像调整为设定宽高,并进行随机水平翻转操作获得预处理待识别图像;步骤S20,基于深度神经网络构建特征提取模型,并进行所述预处理待识别图像的卷积图像特征提取,获得待识别图像的卷积图像特征;预设可学习参数,并基于所述可学习参数分别获取每个类别属性的属性索引特征;步骤S30,基于所述待识别图像的卷积图像特征和所述属性索引特征,通过互注意力序列中的语义空间互注意力模块分别提取待识别图像的属性特征和索引注意力图;步骤S40,以前一个语义空间互注意力模块的输出作为当前语义空间互注意力模块的输入进行n轮迭代,获取最终的待识别图像属性特征;其中,n为预设的互注意力序列中
语义空间互注意力模块的数量;步骤S50,基于所述最终的待识别图像属性特征,通过属性分类器进行分类,获得待识别图像的分类。
[0007]在一些优选的实施例中,所述特征提取模型、所述语义空间互注意力模块和所述属性分类器,其训练中的总损失函数为:其中,代表分类损失函数,代表组内一致性损失损失函数,为预设的超参数。
[0008]在一些优选的实施例中,所述分类损失函数,其表示为:其中,为当前训练批次中样本图像的数量,为当前场景中标注属性的数量,和分别为当前训练批次中第个样本图像第个属性的真实值和预测概率,为当前训练批次中第个样本图像第个属性的加权损失函数。
[0009]在一些优选的实施例中,所述加权损失函数,其表示为:其中,代表当前训练批次中第个样本图像中存在第个属性,代表当前训练批次中第个样本图像中不存在第个属性,代表整个训练样本集中第个属性的正样本概率。
[0010]在一些优选的实施例中,所述组内一致性损失损失函数,其表示为:其中,为当前训练批次中样本图像的数量,为根据行人属性在图像中不同
空间区域划分的属性组数量,为划分后的第个属性组,为第个属性组中符合设定条件的索引注意力图的融合组注意力图对应的组记忆,为当前训练批次中第个样本图像第个属性的语义空间的索引注意力图,为2

范数。
[0011]在一些优选的实施例中,所述设定条件,其表示为:其中,和分别为当前训练批次中第个样本图像第个属性的真实值和预测概率,代表当前训练批次中第个样本图像中存在第个属性,为预设的固定阈值。
[0012]在一些优选的实施例中,所述融合组注意力图,其表示为:其中,和分别为划分后的第个属性组的势和设定条件的势,为指示函数。
[0013]在一些优选的实施例中,所述组记忆通过动量更新的方式在不同的训练样本图像中更新,其方法为:其中,,为预设的动量超参数。
[0014]在一些优选的实施例中,步骤S30中通过互注意力序列中的语义空间互注意力模块分别提取待识别图像的属性特征和索引注意力图,其方法为:其方法为:其方法为:其中,代表互注意力序列中的第个语义空间互注意力模块,为待识别图
像的卷积图像特征,为第个语义空间互注意力模块的输入属性索引特征,、和为不同的参数可学习的线性嵌入函数,为特征提取模型输出的待识别图像的卷积图像特征的层数,为归一化函数,代表矩阵转置。
[0015]本专利技术的另一方面,提出了一种基于属性特征学习解耦的行人属性识别系统,该系统包括以下模块:预处理模块,配置为通过图像缩放和补零填充操作将待识别图像调整为设定宽高,并进行随机水平翻转操作获得预处理待识别图像;卷积特征提取模块,配置为基于深度神经网络构建特征提取模型,并进行所述预处理待识别图像的卷积图像特征提取,获得待识别图像的卷积图像特征;索引特征提取模块,配置为预设可学习参数,并基于所述可学习参数分别获取每个类别属性的属性索引特征;语义空间互注意力模块,配置为基于所述待识别图像的卷积图像特征和所述属性索引特征,通过互注意力序列中的语义空间互注意力模块分别提取待识别图像的属性特征和索引注意力图;互注意力迭代模块,配置为以前一个语义空间互注意力模块的输出作为当前语义空间互注意力模块的输入进行n轮迭代,获取最终的待识别图像属性特征;其中,n为预设的互注意力序列中语义空间互注意力模块的数量;识别模块,配置为基于所述最终的待识别图像属性特征,通过属性分类器进行分类,获得待识别图像的分类。
[0016]本专利技术的有益效果:(1)本专利技术基于属性特征学习解耦的行人属性识别方法,通过对属性特征进行解耦表达,解决了现有技术模型对人体姿态变化、背景环境因素不鲁棒的问题,显著提高了行人属性识别的预测性能,在目前规模最大的公开数据库PA100k上能够达到83.54%的最优性能。
[0017](2)本专利技术基于属性特征学习解耦的行人属性识别方法,计算量和参数量相较于现有技术模型没有显著增加,即在基本保持现有技术的计算量和参数量的前提下,有效提升了模型的性能以及增强了模型对于背景和行人姿态的鲁棒性。
附图说明
[0018]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本专利技术基于属性特征学习解耦的行人属性识别方法的流程示意图。
具体实施方式
[0019]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于属性特征学习解耦的行人属性识别方法,其特征在于,该方法包括:步骤S10,通过图像缩放和补零填充操作将待识别图像调整为设定宽高,并进行随机水平翻转操作获得预处理待识别图像;步骤S20,基于深度神经网络构建特征提取模型,并进行所述预处理待识别图像的卷积图像特征提取,获得待识别图像的卷积图像特征;预设可学习参数,并基于所述可学习参数分别获取每个类别属性的属性索引特征;步骤S30,基于所述待识别图像的卷积图像特征和所述属性索引特征,通过互注意力序列中的语义空间互注意力模块分别提取待识别图像的属性特征和索引注意力图;步骤S40,以前一个语义空间互注意力模块的输出作为当前语义空间互注意力模块的输入进行n轮迭代,获取最终的待识别图像属性特征;其中,n为预设的互注意力序列中语义空间互注意力模块的数量;步骤S50,基于所述最终的待识别图像属性特征,通过属性分类器进行分类,获得待识别图像的分类。2.根据权利要求1所述的基于属性特征学习解耦的行人属性识别方法,其特征在于,所述特征提取模型、所述语义空间互注意力模块和所述属性分类器,其训练中的总损失函数为:其中,代表分类损失函数,代表组内一致性损失损失函数,为预设的超参数。3.根据权利要求2所述的基于属性特征学习解耦的行人属性识别方法,其特征在于,所述分类损失函数,其表示为:其中,为当前训练批次中样本图像的数量,为当前场景中标注属性的数量,和分别为当前训练批次中第个样本图像第个属性的真实值和预测概率,为当前训练批次中第个样本图像第个属性的加权损失函数。4.根据权利要求3所述的基于属性特征学习解耦的行人属性识别方法,其特征在于,所述加权损失函数,其表示为:
其中,代表当前训练批次中第个样本图像中存在第个属性,代表当前训练批次中第个样本图像中不存在第个属性,代表整个训练样本集中第个属性的正样本概率。5.根据权利要求2所述的基于属性特征学习解耦的行人属性识别方法,其特征在于,所述组内一致性损失损失函数,其表示为:其中,为当前训练批次中样本图像的数量,为根据行人属性在图像中不同空间区域划分的属性组数量,为划分后的第个属性组,为第个属性组中符合设定条件的索引注意力图的融合组注意力图对应的组记忆,为当前训练批次中第个样本图像第个属性的语义空间的索引注意力图,为2
‑...

【专利技术属性】
技术研发人员:黄凯奇陈晓棠贾健
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1