一种基于增量学习的人体属性分类方法及装置制造方法及图纸

技术编号:30827324 阅读:18 留言:0更新日期:2021-11-18 12:29
本发明专利技术公开了一种基于增量学习的人体属性分类方法及装置,由存储模块提供人体属性图像集,将人体属性图像输入到深度卷积神经网络进行特征提取;特征提取获得的图像原始特征输入到属性transformer网络中获取全局信息特征;将全局信息特征进行切割,获得更加人性化地描述行人属性对应的局部信息特征;全局信息特征和局部信息特征送入到层级分类器中,得到属性最后的分类结果;当有新的任务时,通过增量学习的方式进行网络微调更新,可以准确快速地获得新任务的属性分类结果。地获得新任务的属性分类结果。地获得新任务的属性分类结果。

【技术实现步骤摘要】
一种基于增量学习的人体属性分类方法及装置


[0001]本专利技术属于计算机视觉
,特别涉及一种基于增量学习的人体属性分类方法及装置。

技术介绍

[0002]人体属性分类是计算机视觉中的热门研究课题之一,也是基于视觉的模式识别应用的一个重要研究方向,它需要将图像中人的各个属性(性别、年龄、衣服类型等)分类出来,从而为针对人的应用提供更加详细的先验信息,比如:行人重识别、行人检索以及视频监控等,由于自然场景中人体不同属性对应不同的局部特征,因此,人体属性分类方法需要具有对不同属性产生其对应局部特征的能力,同时各个属性任务具有不同的需求,如何通过增量学习的方式准确快速的得到属性的类别,是当前面临的难点。
[0003]目前对于人体属性分类常用的方法是基于传统手工设计特征的人体属性分类网络以及基于深度学习的人体属性分类方法,其中基于传统手工设计特征的人体属性分类网络针对人体的内容描述力和判别力不足,在人体属性分类这个问题上很难做到较好的效果,而基于深度学习的人体属性分类方法大多采用注意力机制或者网络整体重训练来解决上述问题,这些方法忽略了不同属性对应着不同的局部特征,从而影响方法的识别性能,同时整个网络重训练会增加网络的训练时间。

技术实现思路

[0004]鉴于此,本专利技术提供一种基于增量学习的人体属性分类方法及装置,通过增量学习的方式,快速且准确的获得人体属性分类结果。
[0005]本专利技术第一实施例提供一种基于增量学习的人体属性分类方法,包括以下步骤:
[0006]步骤S1、将人体属性图像输入到深度卷积神经网络中进行特征提取,获得图像原始特征;
[0007]步骤S2、采用属性transformer网络对图像原始特征进行处理,获得全局信息特征;
[0008]步骤S3、将全局信息特征进行横向切割,获得各个属性对应的局部信息特征;
[0009]步骤S4、将全局信息特征和局部信息特征输入到层级分类器中,获得人体属性分类结果;
[0010]步骤S5、当有新的分类任务时,采用增量学习的方式对深度卷积神经网络进行微调,并执行步骤S1

S4。
[0011]进一步的,所述步骤S2的属性transformer网络包括transformer编码器以及transformer解码器,所述步骤S2包括以下步骤:
[0012]步骤S21、transformer编码器对图像原始特征进行处理,获得一维向量Z


[0013]步骤S22、transformer解码器对一维向量Z

进行维度重组,获得全局信息特征。
[0014]进一步的,所述步骤S21的具体步骤包括:
[0015]步骤S211、将图像原始特征分解成固定大小的特征块;
[0016]步骤S212、对特征块进行线性投影,获得初始一维向量Z∈R
L
×
C
,其中R为实数,L为向量的长度,C为向量的通道数;
[0017]步骤S213、对初始一维向量Z∈R
L
×
C
进行自我注意力计算值,获得自我注意力计算值MSA;
[0018]步骤S214、将自我注意力计算值MSA与多层感知机MLP的输出值合并,获得一维向量Z

,其中多层感知机MLP的输入为自我注意力计算值MSA。
[0019]进一步的,所述步骤S213的具体步骤为:对初始一维向量Z∈R
L
×
C
通过自我注意力机制计算来扩大感受野,并获得自我注意力计算初值SA,其计算公式为:
[0020][0021]其中W
Q
/W
K
/W
V
∈R
C
×
d
为可学习参数,通过对一维向量Z∈R
L
×
C
经可学习的参数进行处理后得到的query、key以及value来获取,其中d为query、key以及value的维度,query=ZW
Q
,key=ZW
K
,value=ZW
V

[0022]获取自我注意力计算初值SA后,根据以下公式获得自我注意力计算值MSA:
[0023]MSA=[SA1;SA2;

;SA
m
];
[0024]其中m为注意力机制的并联个数。
[0025]进一步的,所述步骤S214的计算公式为:
[0026]Z

=MSA(Z
l
‑1)+MLP(MSA(Z
l
‑1))∈R
L
×
C

[0027]进一步的,所述步骤S22的具体步骤为:将一维向量Z

采用维度重组方式恢复成二维,并使用卷积操作得到全局信息特征,其中维度重组的计算过程为:
[0028][0029]其中M为维度重组后的向量,H为特征的高度值,W为特征的宽度值。
[0030]进一步的,所述步骤S3中的局部信息特征的表达式为:
[0031]F
a
=d(F);
[0032]其中F为全局信息特征,d()表示特征切割方法,F
a
为人体属性对应的局部信息特征。
[0033]进一步的,所述步骤S4的具体步骤为:将全局信息特征和局部信息特征输入到第一级分类器中,用于区别对应不同区域的属性,第二级分类器将第一级分类器的分类结果进行细化,并获得人体属性分类结果。
[0034]进一步的,所述步骤S5的具体步骤为:当有新的分类任务时,采用增量学习的方式对深度卷积神经网络的所有全连接层的参数进行微调,并执行步骤S1

步骤S4。
[0035]本专利技术的第二实施例提供一种基于增量学习的人体属性分类装置,包括:存储模块,用于存储人体属性图像;
[0036]处理模块,用于执行第一实施例的基于增量学习的人体属性分类方法;
[0037]所述存储模块将人体属性图像传输给处理模块。
[0038]与现有技术相比,本专利技术的有益效果是:通过属性transformer网络对特征提取后的人体属性图像进行处理后,可以有利于属性的识别,通过切割特征,可以使不同属性获得
其对应的局部信息特征,使网络更加关注感兴趣的区域,减少不相关信息的干扰,在最后进行属性分类时,采用层级分类器进行多级的分类,逐步解析人体属性,可以提升网络的精度,当有新的分类任务进行时,采用增量学习的方式进行网络微调,从而可以快速且准确的获得分类结果,提高分类的效率。
附图说明
[0039]图1为本专利技术的一种基于增量学习的人体属性分类方法的流程图;
[0040]图2为本专利技术的一种基于增量学习的人体属性分类方法的增量学习示意图;
[0041]图3为本专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于增量学习的人体属性分类方法,其特征在于,包括以下步骤:步骤S1、将人体属性图像输入到深度卷积神经网络中进行特征提取,获得图像原始特征;步骤S2、采用属性transformer网络对图像原始特征进行处理,获得全局信息特征;步骤S3、将全局信息特征进行横向切割,获得各个属性对应的局部信息特征;步骤S4、将全局信息特征和局部信息特征输入到层级分类器中,获得人体属性分类结果;步骤S5、当有新的分类任务时,采用增量学习的方式对深度卷积神经网络进行微调,并执行步骤S1

S4。2.根据权利要求1所述的一种基于增量学习的人体属性分类方法,其特征在于,所述步骤S2的属性transformer网络包括transformer编码器以及transformer解码器,所述步骤S2包括以下步骤:步骤S21、transformer编码器对图像原始特征进行处理,获得一维向量Z

;步骤S22、transformer解码器对一维向量Z

进行维度重组,获得全局信息特征。3.根据权利要求2所述的一种基于增量学习的人体属性分类方法,其特征在于,所述步骤S21的具体步骤包括:步骤S211、将图像原始特征分解成固定大小的特征块;步骤S212、对特征块进行线性投影,获得初始一维向量Z∈R
L
×
C
,其中R为实数,L为向量的长度,C为向量的通道数;步骤S213、对初始一维向量Z∈R
L
×
C
进行自我注意力计算值,获得自我注意力计算值MSA;步骤S214、将自我注意力计算值MSA与多层感知机MLP的输出值合并,获得一维向量Z

,其中多层感知机MLP的输入为自我注意力计算值MSA。4.根据权利要求3所述的一种基于增量学习的人体属性分类方法,其特征在于,所述步骤S213的具体步骤为:对初始一维向量Z∈R
L
×
C
通过自我注意力机制计算来扩大感受野,并获得自我注意力计算初值SA,其计算公式为:其中W
Q
/W
K
/W
V
∈R
C
×
d
为可学习参数,通过对一维向量Z∈R
L
×
...

【专利技术属性】
技术研发人员:王浩南
申请(专利权)人:深圳多模智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1