一种基于点框架的高精度人群计数方法技术

技术编号：38853907 阅读：13 留言：0更新日期：2023-09-17 10:00

本发明专利技术涉及高密度人群计数领域，提出了一种基于点框架的高精度人群计数方法：对高密度人群图像数据进行增强处理，将增强后的图像数据输入高精度人群计数模型中进行预测。所述模型包括FasterNet模型，包含EVC模块、第一CSPlayer模块、第二CSPlayer模块和CBAM模块的特征融合模型以及检测头模型。将增强后的图像数据在FasterNet模型中进行特征提取，得到不同尺寸的特征图，将所述不同尺寸的特征图分别输入到特征融合模型中，对输入的不同尺寸的特征图进行不同层次的特征融合。将融合后的特征输入到检测头模型，由检测头模型输出所预测的图像中待测人群的目标位置，根据所预测的目标位置完成对人群的计数。位置完成对人群的计数。位置完成对人群的计数。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于点框架的高精度人群计数方法

[0001]本专利技术涉及人群计数
，尤其是指一种基于点框架的高精度人群计数方法。

技术介绍

[0002]人群计数在计算机视觉领域扮演着越来越重要的角色，其主要任务是输出图像或视频中人群的个体数量。该技术广泛应用于商场客流量统计、公共场所的安全监控、活动现场管理、应急管理、城市交通管理等多个领域。随着深度学习的发展，许多卓越的人群计数模型被提出，人群计数技术的速度和鲁棒性也大幅提升。然而，绝大多数模型处理高密度的场景的结果并不理想。因此，对高密度人群的高精度计数算法迫在眉睫。
[0003]目前常用的一种高精度的人群密度检测网络，在多个数据集上取得了不错的结果，但因其使用ResNet50的结构，对于高密度场景中存在的人群遮挡问题、远景人像模糊问题的预测效果较差，不能准确还原图像。

技术实现思路

[0004]为此，本专利技术所要解决的技术问题在于克服现有技术在高密度场景处理过程中针对人群遮挡、远景人像模糊，预测结果不理想的问题。
[0005]为解决上述技术问题，本专利技术提供了一种基于点框架的高精度人群计数方法，包括：
[0006]步骤1：获取高密度人群图像，对输入的高密度人群图像数据进行增强处理；将增强处理后的图像数据输入训练完成的高精度人群计数模型中进行计数；
[0007]所述高精度人群计数模型包括FasterNet模型、特征提取模型、检测头模型；其中特征提取模型包括EVC模块、第一CSPlayer模块、第二CSPlayer模块...

【技术保护点】

【技术特征摘要】
1.一种基于点框架的高精度人群计数方法，其特征在于，包括：步骤1：获取高密度人群图像，对输入的高密度人群图像数据进行增强处理；将增强处理后的图像数据输入训练完成的高精度人群计数模型中进行计数；所述高精度人群计数模型包括FasterNet模型、特征提取模型、检测头模型；其中特征提取模型包括EVC模块、第一CSPlayer模块、第二CSPlayer模块和CBAM模块；步骤2：采用具有4层结构的FasterNet模型对增强后的图像数据进行特征的提取；将增强后的图像数据输入所述FasterNet模型中，将FasterNet模型中第4层、第3层、第2层提取到的特征图分别作为输入，进行特征融合；步骤3：将上述第4层提取到的特征图输入EVC模块进行融合；将融合后的新特征通过二倍上采样后与第3层提取到的特征进行拼接；将拼接后的特征输入第一CSPlayer模块中进行融合；将融合后的新特征通过二倍上采样后与第2层提取到的特征进行拼接；将拼接后的特征输入第二CSPlayer模块进行融合；将融合后的特征图输入至CBAM模块进行融合；CBAM输出的结果即为特征融合后的结果；步骤4：将特征融合后的数据输入检测头模型，由检测头输出所预测的图像中待测人群的目标位置，根据目标位置得出人群计数的结果。2.根据权利要求1所述的一种基于点框架的高精度人群计数方法，其特征在于：对于所述高精度人群计数模型进行训练过程包括：获取高密度人群图像训练数据集，定义数据集为标签为标签为表示，N为数据集中图片的数量；其中，X
i
为数据集中第i张高密度人群图像，大小为m
×
n，P
i
为数据集中第i张高密度人群图像的标签，N'为P
i
中的标记点个数，(x
j
,y
j
)表示图像中第j个标记点的横坐标与纵坐标；对训练数据集中的高密度人群图像及标签进行增强处理；将处理后的图像样本输入高精度人群计数模型，得到图像样本的预测点及置信度，使用匈牙利算法将预测点与GroundTruth点进行匹配，得到匹配结果，根据匹配结果和置信度定义损失函数，训练模型，直至损失函数收敛。3.根据权利要求2所述的一种基于点框架的高精度人群计数方法，其特征在于：所述对训练数据集中的高密度人群及标签进行增强处理包括：读入高密度人群图像X
i
后，以0.7至1.3的比例对图像进行随机缩放，再进行128
×
128大小的随机剪裁，最后用0.5的概率对图像进行水平翻转；对图像标签P
i
进行点回归，首先对P
i
进行0.7至1.3比例的缩放，其次选择剪裁出图像中对应的坐标的P
i
，最后与图像同步翻转。4.根据权利要求2所述的一种基于点框架的高精度人群计数方法，其特征在于：所述使用匈牙利算法将预测点与GroundTruth点进行匹配，得到匹配结果包括：高精度人群计数模型输出的预测点的个数为M，GroundTruth点的个数为N'，M>N'，用ξ表示算法的匹配结果：
其中，P
i
为GroundTruth点，为预测点，为匹配后的预测点，表示匹配为正样本的个数，表示...

【专利技术属性】
技术研发人员：张莉，马浩远，赵雷，王邦军，
申请(专利权)人：苏州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人