一种基于多尺度空间校正的行人属性识别方法技术

技术编号：27818495 阅读：15 留言：0更新日期：2021-03-30 10:25

本发明专利技术公开了一种基于多尺度空间校正的行人属性识别方法，该方法包括获取行人图像数据，并进行预处理；构建包含特征金字塔结构、空间校正模块和多尺度特征融合模块的行人属性识别网络模型，采用预处理后的行人图像数据进行模型训练；利用训练后的行人属性识别网络模型对待识别行人图像中的行人属性进行识别。本发明专利技术利用空间校正模块将特征金字塔中的相邻特征同时输入，利用小尺度的高层语义信息指导大尺度的低层进行特征转换；并利用特征融合模块，将特征金字塔中所有尺度的特征融合，建立多尺度空间关联依赖关系，显著提高小目标、低分辨率图像识别效果。分辨率图像识别效果。分辨率图像识别效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多尺度空间校正的行人属性识别方法

[0001]本专利技术涉及行人属性识别
，具体涉及一种基于多尺度空间校正的行人属性识别方法。

技术介绍

[0002]随着社会对安防领域的重视和安防领域的不断发展，安防和AI结合得日益紧密。其中，智能视频分析受到广泛的关注，视频图像是当今社会最广泛的信息载体，特别是在视频监控中，发挥着重要的信息采集和记录的作用。视频是典型的非结构化数据，需要智能化算法来辅助进行结构化分析。在视频监控中，人是安防工作的主体，在安防工作中实现对行人目标和其属性特征的有效识别，那将会极大提高安防工作的应对能力。
[0003]更具体来说，行人属性是一种关于人的可检索语义描述，可作为软生物特征应用在视频监控中。对于给定的人物图像，行人属性识别的目的是从预先定义的属性列表中预测一组描述该人物特征的属性。与方向梯度直方图、局部二值模式等低级特征不同，属性可以看作是高级语义信息，对视角变化和观察条件的变化具有更强的鲁棒性。因此，计算机视觉领域许多算法，如行人重识别、行人检测，都会集成行人的属性以提升算法的鲁棒性。
[0004]局部区域特征对于细粒度属性分类十分重要，但由于细粒度属性（例如鞋子、眼镜等）在图像中占比较小，识别比较困难。同时，高质量的监控摄像头价格昂贵，图像的分辨率通常很低，加之开放环境应用中存在人像遮挡、镜头模糊等问题，使得有效提取小区域的特征更加困难。因此在这种复杂场景低分辨率情况的图片下，有效提取小区域属性特征是一个关键问题。

技术实现思路

[0005]...

【技术保护点】

【技术特征摘要】
1.一种基于多尺度空间校正的行人属性识别方法，其特征在于，包括以下步骤：S1、获取行人图像数据，并进行预处理；S2、构建包含特征金字塔结构、空间校正模块和多尺度特征融合模块的行人属性识别网络模型，采用预处理后的行人图像数据进行模型训练；S3、利用训练后的行人属性识别网络模型对待识别行人图像中的行人属性进行识别。2.根据权利要求1所述的基于多尺度空间校正的行人属性识别方法，其特征在于，所述步骤S1具体包括以下分步骤：S11、采集视频监控图像，并利用行人目标检测算法进行目标裁剪，得到行人图像数据；S12、对行人图像数据进行人工标注；S13、对标注后的行人图像数据进行归一化、尺度放缩、填充、随机裁剪、水平翻转或垂直翻转以及图片格式张量转换的图像预处理。3.根据权利要求1所述的基于多尺度空间校正的行人属性识别方法，其特征在于，所述步骤S2采用预处理后的行人图像数据进行模型训练具体包括以下分步骤：S21、利用特征金字塔结构提取预处理后的行人图像数据的多尺度图像特征；S22、利用空间校正模块将特征金字塔结构中相邻的不同尺度特征进行初步融合和空间校准；S23、利用多尺度特征融合模块将经过空间校准后的多尺度图像特征进行多尺度特征融合；S24、将经过多尺度特征融合的不同尺度输出特征和主分支输出特征通过SE
‑
Net的通道注意力子网络进行分类预测。4.根据权利要求3所述的基于多尺度空间校正的行人属性识别方法，其特征在于，所述步骤S21具体包括以下分步骤：S211、构建主网络对预处理后的行人图像数据提取不同尺度的图像特征，i为尺度序号；S212、分别对各个尺度的图像特征经过卷积层进行通道转换，得到转换后的特征。5.根据权利要求3所述的基于多尺度空间校正的行人属性识别方法，其特征在于，所述步骤S22具体包括以下分步骤：S221、选取相邻的两个不同尺度特征，将特征进行上采样后再将两个特征进行初步融合，得到融合特征，表示为其中，表示上采样操作，表示Sigmoid激活函数；S222、根据特征和融合特征进行特征变换，得到权重，表示为，表示为

【专利技术属性】
技术研发人员：尚天淇，彭德中，陈琳，
申请(专利权)人：四川大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人