一种基于特征聚合的着装分类方法及系统技术方案

技术编号:32117562 阅读:58 留言:0更新日期:2022-01-29 19:02
本发明专利技术公开一种基于特征聚合的着装分类方法及系统,涉及图像处理技术领域,包括:对图像训练集基于预先构建的分类模型进行多层特征提取;对每层提取的特征进行通道维度变换,将特征维度压缩至与图像训练集中的类别数量一致,得到压缩后的特征;对每层压缩后的特征进行余弦变换,将特征映射到角度空间并对特征进行聚合,经特征聚合后构建损失函数;根据损失函数对分类模型进行训练,对待识别着装图像根据训练后的分类模型着装分类结果。通过加权融合系数的方式,充分利用浅层的颜色信息和深层的轮廓信息,同时增加特征聚合操作将特征信息映射到角度空间,得到最大化的分类界限,增加着装匹配过程的相似度差距。加着装匹配过程的相似度差距。加着装匹配过程的相似度差距。

【技术实现步骤摘要】
一种基于特征聚合的着装分类方法及系统


[0001]本专利技术涉及图像处理
,特别是涉及一种基于特征聚合的着装分类方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]目前在服务行业,对服务窗口、企业生产、建筑工地等相关工作人员的标准着装提出约束,而且,标准化着装不仅可以提高服务形象、增强企业生产效率,也可降低安全生产事故。现有的基于深度学习算法的着装检测方法,主要是采用分类网络对目标进行分类或与标准着装进行相似度对比,进而实现着装检测功能。此方法的优点在于,分类网络训练简单、着装检测过程简单快捷。
[0004]分类模型的核心就是寻找自于卷积网络的最终的样本特征间最优的分类界限,达到目标分类效果。深度学习网络随着卷积层数的布点加深,样本自身的颜色、轮廓、纹理等表层特征也不断的减少,而深层的抽象特征不断增加。由于工装样本的特殊性,即存在颜色相近的着装类型,进而导致分类界限不够明显,导致在进行标准着装匹配过程相似度差距较小,影响检测结果,因此,对于着装样本的特征不仅需要深层的抽象特征,也需要颜色、轮廓、纹理等浅层特征。
[0005]中国专利CN114183472A公开了一种基于改进RetinaNet的试验场人员是否穿着工作服检测方法,采用去除分类层的MobileNet进行图像多尺度特征提取,获取图像的三张多尺度特征图,通过Resnet18进行服装类别分类,实现着装检测功能。该方法本质还是采用分类网络实现着装类型分类功能,针对特定场景,对环境变化导致着装区分度下降时,并没有提出解决方法。
[0006]中国专利CN110059674A公开了一种基于深度学习的标准着装检测方法,该方法通过改进目标检测算法中锚点的设置参数,在训练样本中,增加口罩、帽子等相关类别,在实现目标检测的同时,完成目标分类,进而判断是否按要求着装。该方法网络结构简单、检测速度快,但并未对如何提高相似着装区分度上,提出解决方法。
[0007]中国专利CN111401418A公开了一种基于改进Faster r

cnn的员工着装规范检测方法,针对不同的应用场景进行样本数据集的采集、标注、数据增强;建立改进后的Faster r

cnn网络模型;使用增强后的训练样本集对改进后的网络进行训练;用训练好的网络模型对测试样本集进行检测;分析检测结果是否符合预定义的着装规范。虽然采用数据增强方法,增加样本的多样性,但是在样本类间差异性上并未提出改进方法。

技术实现思路

[0008]为了解决上述问题,本专利技术提出了一种基于特征聚合的着装分类方法及系统,在通道维度变换时,将特征维度压缩至与图像训练集中的类别数量一致,并通过加权融合系
数的方式,充分利用浅层的颜色、纹理信息和深层的轮廓信息,同时,增加特征聚合操作将特征信息映射到角度空间,得到最大化的分类界限,增加着装匹配过程的相似度差距。
[0009]为了实现上述目的,本专利技术采用如下技术方案:
[0010]第一方面,本专利技术提供一种基于特征聚合的着装分类方法,包括:
[0011]对图像训练集基于预先构建的分类模型进行多层特征提取;
[0012]对每层提取的特征进行通道维度变换,将特征维度压缩至与图像训练集中的类别数量一致,得到压缩后的特征;
[0013]对每层压缩后的特征进行余弦变换,将特征映射到角度空间并对特征进行聚合,经特征聚合后构建损失函数;
[0014]根据损失函数对分类模型进行训练,对待识别着装图像根据训练后的分类模型着装分类结果。
[0015]作为可选择的实施方式,所述提取的多层特征具体为浅层的颜色特征、浅层的纹理特征、深层的轮廓特征以及深层的抽象特征。
[0016]作为可选择的实施方式,多层特征提取的过程为,除最后一层特征层外,其余每层的输出依次经卷积操作和最大均值操作进行特征提取;最后一层特征层以上一层的输出为输入,直接进行最大均值操作。
[0017]作为可选择的实施方式,所述通道维度变换为,在分类模型中添加线性链接层,根据线性链接层的权重系数对特征维度进行压缩。
[0018]作为可选择的实施方式,每层压缩后的特征为:
[0019]其中,Linear()表示线性链接操作,W
cls
为线性链接层的权重系数,其维度是W
cls
∈R
2048,n
,n为图像训练集中的类别数量,F为每层提取的特征。
[0020]作为可选择的实施方式,对每层压缩后的特征进行余弦变换,得到:F
cls
=||W
cls
||||F||cosθ;
[0021]其中,F
cls
为压缩后的特征,W
cls
为线性链接层的权重系数,n为图像训练集中的类别数量,F为每层提取的特征,θ为余弦夹角。
[0022]作为可选择的实施方式,每层的损失函数为:
[0023][0024]其中,为线性链接层权重系数W
cls
中,特征输出到第i个输出神经元的链接权重;f
i
为线性链接层中第i神经元的输出;θ
i
为余弦夹角;m为间隔参数;s为缩放因子。
[0025]作为可选择的实施方式,将特征映射到角度空间并对特征进行聚合的过程中,将特征映射到角度空间上的一个超球面,由缩放因子s控制超球面半径,由间隔参数m控制特征聚合度,随着m的增加,特征间差异性越高,特征聚合度越高。
[0026]第二方面,本专利技术提供一种基于特征聚合的着装分类系统,包括:
[0027]特征提取模块,被配置为对图像训练集基于预先构建的分类模型进行多层特征提取;
[0028]维度变换模块,被配置为对每层提取的特征进行通道维度变换,将特征维度压缩
至与图像训练集中的类别数量一致,得到压缩后的特征;
[0029]特征聚合模块,被配置为对每层压缩后的特征进行余弦变换,将特征映射到角度空间并对特征进行聚合,经特征聚合后构建损失函数;
[0030]着装分类模块,被配置为根据损失函数对分类模型进行训练,对待识别着装图像根据训练后的分类模型着装分类结果。
[0031]第三方面,本专利技术提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成第一方面所述的方法。
[0032]第四方面,本专利技术提供一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述的方法。
[0033]与现有技术相比,本专利技术的有益效果为:
[0034]本专利技术的基于特征聚合的着装分类方法及系统中,对图像训练集进行特征提取时,每层特征提取层均输出不同维度的特征,在进行通道变换时,通过添加线性链接层,通过线性链接层的权重系数将输出特征维度压缩至类别数量,通过加本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于特征聚合的着装分类方法,其特征在于,包括:对图像训练集基于预先构建的分类模型进行多层特征提取;对每层提取的特征进行通道维度变换,将特征维度压缩至与图像训练集中的类别数量一致,得到压缩后的特征;对每层压缩后的特征进行余弦变换,将特征映射到角度空间并对特征进行聚合,经特征聚合后构建损失函数;根据损失函数对分类模型进行训练,对待识别着装图像根据训练后的分类模型着装分类结果。2.如权利要求1所述的一种基于特征聚合的着装分类方法,其特征在于,多层特征提取的过程为,除最后一层特征层外,其余每层的输出依次经卷积操作和最大均值操作进行特征提取;最后一层特征层以上一层的输出为输入,直接进行最大均值操作。3.如权利要求1所述的一种基于特征聚合的着装分类方法,其特征在于,所述通道维度变换为,在分类模型中添加线性链接层,根据线性链接层的权重系数对特征维度进行压缩。4.如权利要求1所述的一种基于特征聚合的着装分类方法,其特征在于,每层压缩后的特征为:其中,Linear()表示线性链接操作,W
cls
为线性链接层的权重系数,其维度是W
cls
∈R
2048,n
,n为图像训练集中的类别数量,F为每层提取的特征。5.如权利要求1所述的一种基于特征聚合的着装分类方法,其特征在于,对每层压缩后的特征进行余弦变换,得到:F
cls
=||W
cls
||||F||cosθ;其中,F
cls
为压缩后的特征,W
cls
为线性链接层的权重系数,n为图像训练集中的类别数量,F为每层...

【专利技术属性】
技术研发人员:高朋刘辰飞陈英鹏席道亮
申请(专利权)人:神思电子技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1