行人属性识别方法、相关设备及计算机可读存储介质技术

技术编号:29759215 阅读:25 留言:0更新日期:2021-08-20 21:12
本发明专利技术实施例提供了一种行人属性识别方法,其包括步骤:S1、获取行人图像,并生成行人图像数据;S2、数据增强处理和均值化处理,生成输入行人图像;S3、通过特征提取模型进行特征提取并生成特征图;S4、通过预测模型处理;S5、通过加权的分类损失函数计算,将计算结果监督训练模型的训练学习,返回S3;S6、判断准确率是否达到预设标准:若否,则进入S7;若是,则结束所述训练模型的训练学习;S7、对特征提取模型的超参数进行调整,返回S3。本发明专利技术实施例还提供了一种行人属性识别设备和计算机可读存储介质。采用本发明专利技术的技术方案可采集和标注大规模行人属性识别数据集,且行人属性识别的效果好。

【技术实现步骤摘要】
行人属性识别方法、相关设备及计算机可读存储介质
本专利技术涉及人工智能
,尤其涉及一种行人属性识别方法、行人属性识别设备以及计算机可读存储介质。
技术介绍
近年视频监控应用越来越广,通过监控视频采集的行人图像可以应用于治安、统计等方面,行人图像的识别越来越重要。目前,行人属性识别非常具有挑战性:首先,行人图像质量差,如分辨率低,遮挡,光线不足以及尺度变换等。第二,通过多摄像头拍摄的监控视频往往存在多角度、跨场景以及跨时间等问题,导致即使是对于同一个行人,在不同角度,场景和时间下,所采集的行人图像差异较大。第三,目前业界行人属性识别数据集的标注多样,具体表现为数据集量级、行人属性类别以及行人属性分布均不一致。业界中常用的行人属性识别数据集有PETA,RAP以及PA-100k等,其中PETA数据集包含8704个行人,共19000张行人图像,每个行人标注了61个二分类属性和4个多分类属性,该数据集行人属性标注丰富,但数据量较少。RAP数据集包含41585张行人图像,每个行人标注了69个二分类属性和3个多分类属性,该数据集同样行人属性标注丰富,但数据量较少。PA-100k数据集包含100000张行人图像,每个人行人标注了26个二分类属性,该数据集行人属性标注较少,但数据量较大。由此可以看出,各个行人属性识别数据集差异较大且存在多种问题。除此之外,由于行人图像采集困难,对行人图像的采集和标注造成较大的困难,导致数据集规模不足以及属性分布不均衡,即存在长尾现象。现有技术中,行人属性识别任务主要围绕着手工提取低级的视觉特征展开,利用多种分类模型取得行人属性结果表示,例如方向梯度直方图(HOG)、尺度不变特征转换(SIFT)、条件随机场模型(CRF)以及支持向量机(SVM)等。Layne和HOSPEDALES等人首先使用支持向量模型解决了行人属性识别问题。这些传统方法在小规模数据集上取得了一定的成功,但是对于大规模的数据集,这些基于人工标注特征的方法受到了重重限制,而且传统的算法忽略了行人属性之间高阶联系,不能有效提取行人图像属性特征,因此无法满足实际场景中的应用要求。随着深度卷积神经网络(CNN)的快速发展,研究员开始着手于将深度卷积神经网络应用于行人属性识别任务中,并取得了一定成果。例如:Li等人提出使用CNN模型进行行人属性识别,运用CNN对行人图像进行特征提取,设计DeepMAR网络对行人多属性进行联合学习,同时设计加权分类函数,一定程度上解决类别不均衡问题。Liu等人提出了一种基于注意力机制的深度神经网络HP-Net,该模型能够从浅层到语义层补货注意力,挖掘到多尺度的注意力特征,有效的对行人特征进行表示,同时还能学习到行人的局部细粒度特征,从而充实全局特征,进一步提升行人特征表示。Tang等人提出了一个基于SENet模块的行人属性定位模型以及STN网络,提取不同层,不同部位的行人特征并进行融合,使得有效的特征权重大,无效或者效果弱的特征权重小,最后对行人属性识别结果进行融合,有效的表示了行人属性。Guo等人提出了一个图像变化下,模型注意力一致性的模型,学习行人图像的不变性,例如反转、缩放等操作,对原始行人图像以及经过数据增强后的行人图像输入模型,将两部分特征进行融合,以此得到一个有效的行人特征表示。然而,上述的深度卷积神经网络应用于行人属性识别任务的技术方案都是应用在小规模数据集上,该规模一般小于1万,无法比拟现实场景数据,对于现实场景中的大规模数据无法得到很好的验证。同时大部分模型都是针对特定的数据集而设定,且比较复杂,鲁棒性不够强,不能满足实际应用场景中复杂多变的情形;同时无法很好的对遮挡,模糊的行人图像进行识别,还有无法很好的解决类别分布不均衡等问题。因此,实有必要提供一种新的方法和设备来解决上述技术问题。
技术实现思路
本专利技术的目的是克服上述技术问题,提供一种可采集和标注大规模行人属性识别数据集,且行人属性识别的效果好的行人属性识别方法、行人属性识别设备以及计算机可读存储介质。第一方面,本专利技术实施例提供一种行人属性识别方法,应用于神经网络,所述神经网络包括主干网络和与所述主干网络通信连接的全连接层,所述神经网络设置为训练模型,所述训练模型包括由所述主干网络设置的用于提取特征的特征提取模型和由所述全连接层中由N个神经元设置形成的预测模型,N为行人属性的类别数;该方法包括如下步骤:步骤S1、获取行人图像,将所述行人图像标注多类行人属性并生成行人图像数据,所述行人图像数据包括所述行人图像的文件名和与所述行人图像相对应的行人属性标注;步骤S2、将所述行人图像数据依次进行数据增强处理和均值化处理,再将处理后的所述行人图像数据转换生成预设格式的输入行人图像;步骤S3、将所述输入行人图像输入至所述主干网络,再通过所述特征提取模型将所述输入行人图像进行特征提取并生成特征图,以用于预测行人属性,所述特征图为一维图像;步骤S4、将所述特征图输入至所述全连接层,再通过所述预测模型将所述特征图进行训练学习,所述预测模型将训练学习完成后的所述全连接层中的每个神经元的输出行人属性分类数,并将输出的所述行人属性分类数作为一个行人属性预测概率,再将所有的所述行人属性预测概率中概率最大的一个作为当前行人属性预测值,所述训练学习为所述预测模型学习神经元参数;步骤S5、将所述当前行人属性预测值输入至预设的加权的分类损失函数进行计算得到计算结果,并根据所述计算结果分别训练所述训练模型的模型参数和调整所述训练模型的模式结构,以用于监督所述训练模型的训练学习,并返回所述步骤S3,所述监督为所述训练模型根据训练误差更新所述模型参数的权重;步骤S6、获取所述当前行人属性预测值在预设的验证集中相对应的准确率,并判断所述准确率是否达到预设标准:若否,则进入步骤S7;若是,则结束所述特征提取模型的训练学习;步骤S7、根据预设规则对所述特征提取模型的超参数进行调整,并返回所述步骤S3。更优的,所述步骤S1中,所述行人属性包括性别、骑车状态、服装及口罩状态。更优的,所述步骤S2中,所述数据增强处理包括尺度变换、随机裁剪、随机亮度变化、填充、随机翻折以及随机擦除。更优的,所述步骤S3中,所述主干网络为Resnet-50,所述特征图为将所述特征提取模型中的最后一个残差模块输出的特征图拉伸到一维形成。更优的,所述步骤S4中,所述预测模型通过修改最后一层所述全连接层的神经元数量作为行人属性分类数。更优的,所述步骤S5中,所述加权的分类损失函数为加权的二分类交叉熵损失函数,满足以下公式:其中,Loss为二分类交叉熵损失函数,N为输入行人图像个数,M为属性类别数,为对应每个属性的权值,为属性真实标签,为预测模型的预测属性值,为Sigmod函数。更优的,所述步骤S5中,所述训练模型通过反向传播和Adam优化器更新所述训练模型的模型参数。更优的,所述步骤S7中,所述超参数包括学习率、批大小以及训练次数本文档来自技高网
...

【技术保护点】
1.一种行人属性识别方法,应用于神经网络,所述神经网络包括主干网络和与所述主干网络通信连接的全连接层,其特征在于,所述神经网络设置为训练模型,所述训练模型包括由所述主干网络设置的用于提取特征的特征提取模型和由所述全连接层中由N个神经元设置形成的预测模型,N为行人属性的类别数;该方法包括如下步骤:/n步骤S1、获取行人图像,将所述行人图像标注多类行人属性并生成行人图像数据,所述行人图像数据包括所述行人图像的文件名和与所述行人图像相对应的行人属性标注;/n步骤S2、将所述行人图像数据依次进行数据增强处理和均值化处理,再将处理后的所述行人图像数据转换生成预设格式的输入行人图像;/n步骤S3、将所述输入行人图像输入至所述主干网络,再通过所述特征提取模型将所述输入行人图像进行特征提取并生成特征图,以用于预测行人属性,所述特征图为一维图像;/n步骤S4、将所述特征图输入至所述全连接层,再通过所述预测模型将所述特征图进行训练学习,所述预测模型将训练学习完成后的所述全连接层中的每个神经元的输出行人属性分类数,并将输出的所述行人属性分类数作为一个行人属性预测概率,再将所有的所述行人属性预测概率中概率最大的一个作为当前行人属性预测值,所述训练学习为所述预测模型学习神经元参数;/n步骤S5、将所述当前行人属性预测值输入至预设的加权的分类损失函数进行计算得到计算结果,并根据所述计算结果分别训练所述训练模型的模型参数和调整所述训练模型的模式结构,以用于监督所述训练模型的训练学习,并返回所述步骤S3,所述监督为所述训练模型根据训练误差更新所述模型参数的权重;/n步骤S6、获取所述当前行人属性预测值在预设的验证集中相对应的准确率,并判断所述准确率是否达到预设标准:/n若否,则进入步骤S7;若是,则结束所述训练模型的训练学习;/n步骤S7、根据预设规则对所述特征提取模型的超参数进行调整,并返回所述步骤S3。/n...

【技术特征摘要】
1.一种行人属性识别方法,应用于神经网络,所述神经网络包括主干网络和与所述主干网络通信连接的全连接层,其特征在于,所述神经网络设置为训练模型,所述训练模型包括由所述主干网络设置的用于提取特征的特征提取模型和由所述全连接层中由N个神经元设置形成的预测模型,N为行人属性的类别数;该方法包括如下步骤:
步骤S1、获取行人图像,将所述行人图像标注多类行人属性并生成行人图像数据,所述行人图像数据包括所述行人图像的文件名和与所述行人图像相对应的行人属性标注;
步骤S2、将所述行人图像数据依次进行数据增强处理和均值化处理,再将处理后的所述行人图像数据转换生成预设格式的输入行人图像;
步骤S3、将所述输入行人图像输入至所述主干网络,再通过所述特征提取模型将所述输入行人图像进行特征提取并生成特征图,以用于预测行人属性,所述特征图为一维图像;
步骤S4、将所述特征图输入至所述全连接层,再通过所述预测模型将所述特征图进行训练学习,所述预测模型将训练学习完成后的所述全连接层中的每个神经元的输出行人属性分类数,并将输出的所述行人属性分类数作为一个行人属性预测概率,再将所有的所述行人属性预测概率中概率最大的一个作为当前行人属性预测值,所述训练学习为所述预测模型学习神经元参数;
步骤S5、将所述当前行人属性预测值输入至预设的加权的分类损失函数进行计算得到计算结果,并根据所述计算结果分别训练所述训练模型的模型参数和调整所述训练模型的模式结构,以用于监督所述训练模型的训练学习,并返回所述步骤S3,所述监督为所述训练模型根据训练误差更新所述模型参数的权重;
步骤S6、获取所述当前行人属性预测值在预设的验证集中相对应的准确率,并判断所述准确率是否达到预设标准:
若否,则进入步骤S7;若是,则结束所述训练模型的训练学习;
步骤S7、根据预设规则对所述特征提取模型的超参数进行调整,并返回所述步骤S3。


2.根据权利要求1所述的行人属性...

【专利技术属性】
技术研发人员:吴超杨巨成魏峰何嘉明郭庆闫潇宁
申请(专利权)人:深圳市安软科技股份有限公司深圳市安软慧视科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1