当前位置: 首页 > 专利查询>郑州大学专利>正文

一种复杂场景中流动人群的分布与计数检测的方法技术

技术编号:21433272 阅读:43 留言:0更新日期:2019-06-22 12:14
本发明专利技术公开了一种复杂场景中流动人群的分布与计数检测的方法。该方法包括的步骤有:构建预训练模型、多层网络初始化、特征提取与感知、融合估算人群数量。基于这些步骤,可以先通过构建一列单列的卷积神经网络作为预训练模型,融入多层卷积神经网络中,然后再通过对人群密度信息感知,将待识别图像中的多尺度信息,通过分类感知以及得分图的方式融合进整个网络中,从而提高该网络识别人群的准确率和执行效率,以及良好的可迁移性。

【技术实现步骤摘要】
一种复杂场景中流动人群的分布与计数检测的方法
本专利技术涉及计算机视觉
,具体涉及一种复杂场景中流动人群的分布与计数检测的方法。
技术介绍
随着居住人口密度的增长,在车站、广场、公园等公共场所,人群大量聚集的频率越来越高,聚集密度变得越来越大。作为计算机视觉的热门方向之一,人群数量检测对于公共安全管理、信息资源管理、公共交通管理等方面具有重要意义。比如,对人群高频率集会的场景,实行实时无人监控;用对于城市公交系统,通过及时获得乘客在空间、时间上的分布情况来灵活调整车辆运行时间表;对于大型商场,通过顾客的流量信息来制定高效率的营销策略等。现有技术中,对于复杂场景中流动人群的检测统计方法,由于存在各种复杂因素,例如遮挡,场景杂乱无章,人群分布不均匀,光照不均匀,场景差异,尺度和视角的变化,难以获得准确的统计结果。而且现有技术中采用多列/多个卷积神经网络进行统计预测,则会引入更多的参数,消耗计算资源,难以实际应用,所以很难产生高精度的预测结果。
技术实现思路
本专利技术主要解决的技术问题是提供一种复杂场景中流动人群的分布与计数检测的方法,解决现有技术中的对人群数量检测计算资源消耗多、估算精度低等问题。为解决上述技术问题,本专利技术采用的一个技术方案是提供一种复杂场景中流动人群的分布与计数检测的方法,包括以下步骤:构建预训练模型,构建一单列卷积神经网络BLCNN模型,利用公开数据集提供的原始图像作为输入,以所述原始图像中对应的人群标注文件作为输出,对所述BLCNN模型进行训练,得到预训练模型;多层网络初始化,利用所述预训练模型对多层卷积神经网络MLCNN网络初始化,所述MLCNN网络包括由所述预训练模型构成的第一层网络,以及在所述第一层网络之后并行分开的感知支路网络和融合支路网络;特征提取与感知,将待识别图像输入到所述第一层网络提取特征信息,所述特征信息进一步输入到感知支路网络得到感知信息,所述感知信息还输入到所述融合支路网络进行信息融合;融合估算人群数量,所述特征信息还输入到融合支路网络,并利用所述感知信息进行信息融合和密度估算,得到所述待识别图像中对应的人群数量。在本专利技术复杂场景中流动人群的分布与计数检测的方法另一实施例中,所述预训练模型包括依次串联的两个层级:VGG-G5层级和Shared-Net层级,在所述VGG-G5层级中又进一步包括依次串联的五级卷积池化层,均采用了3×3的卷积核和2×2的池化层。在本专利技术复杂场景中流动人群的分布与计数检测的方法另一实施例中,所述五级卷积池化层对于的第一级卷积池化层包括64个3×3的卷积核,且由两组3×3×64的卷积核堆叠而成;第二级卷积池化层包括128个3×3的卷积核,且由两组3×3×128的卷积核堆叠而成;第三级卷积池化层包括256个3×3的卷积核,且由三组3×3×256的卷积核堆叠而成;第四级卷积池化层包括512个3×3的卷积核,且由三组3×3×512的卷积核堆叠而成;第五级卷积池化层包括512个3×3的卷积核,且由两组3×3×512的卷积核堆叠而成。在本专利技术复杂场景中流动人群的分布与计数检测的方法另一实施例中,所述Shared-Net层级进一步包括依次串联的卷积层和反卷积层:第一卷积层为1×1×256卷积层,第二反卷积层为2×2×128的反卷积层,第三卷积层为3×3×128卷积层,第四卷积层为1×1×128卷积层,第五卷积层为3×3×128卷积层,第六卷积层为1×1×1的卷积层,由所述第五卷积层输出得到128维的特征图,经过第六卷积层后输出人群密度图,累加所述人群密度图的二维矩阵值得到预测出的人群数量。在本专利技术复杂场景中流动人群的分布与计数检测的方法另一实施例中,利用所述预训练模型对多层卷积神经网络MLCNN网络初始化包括仅将所述预训练模型的VGG-G5层级用于构建所述MLCNN网络的第一层网络。在本专利技术复杂场景中流动人群的分布与计数检测的方法另一实施例中,所述感知支路网络包括第六级卷积池化层、第七级卷积池化层、第八级卷积池化层、第九级卷积池化层和全局平均池化层。在本专利技术复杂场景中流动人群的分布与计数检测的方法另一实施例中,所述第六级卷积池化层为1×1×256卷积层,所述第七级卷积池化层为2×2×128反卷积层,所述第八级卷积池化层包括五组1×1×5卷积层,所述第九级卷积池化层为1×1×1卷积层,所述全局平均池化层对第九级卷积池化层输出的特征图进行密度分类得分。在本专利技术复杂场景中流动人群的分布与计数检测的方法另一实施例中,所述融合支路网络包括第十级卷积池化层、第十一级卷积池化层、第十二级卷积池化层、融合层、第十三级卷积池化层和密度图预测层。在本专利技术复杂场景中流动人群的分布与计数检测的方法另一实施例中,所述第十级卷积池化层为1×1×256卷积层,所述第十一级卷积池化层2×2×128反卷积层,所述第十二级卷积池化层为3×3×128卷积层,所述融合层将来自所述感知支路网络的第八级卷积池化层对应输出的25个特征图与所述第十二级卷积池化层输出的128个特征图融合得到153个特征图,所述第十三级卷积池化层由两个3×3×153卷积层堆叠而成,所述密度图预测层为参数量为1×1×153×1的卷积层。在本专利技术复杂场景中流动人群的分布与计数检测的方法另一实施例中,所述25个特征图为语义特征图,所述第十二级卷积池化层输出的128个特征图为高维特征图。在本专利技术复杂场景中流动人群的分布与计数检测的方法另一实施例中,本专利技术的有益效果是:本专利技术公开了一种复杂场景中流动人群的分布与计数检测的方法。该方法包括的步骤有:构建预训练模型、多层网络初始化、特征提取与感知、融合估算人群数量。基于这些步骤,可以先通过构建一列单列的卷积神经网络作为预训练模型,融入多层卷积神经网络中,然后再通过对人群密度信息感知,将待识别图像中的多尺度信息,通过分类感知以及得分图的方式融合进整个网络中,从而提高该网络识别人群的准确率和执行效率,以及良好的可迁移性。附图说明图1是根据本专利技术复杂场景中流动人群的分布与计数检测的方法一实施例的流程图;图2是根据本专利技术复杂场景中流动人群的分布与计数检测的方法另一实施例中的预训练模型示意图;图3是根据本专利技术复杂场景中流动人群的分布与计数检测的方法另一实施例中的多层卷积神经网络MLCNN组成框图;图4是根据本专利技术复杂场景中流动人群的分布与计数检测的方法另一实施例中的人群密度分布划分示意图;图5是根据本专利技术复杂场景中流动人群的分布与计数检测的方法另一实施例中的人群检测效果分析示意图;图6是根据本专利技术复杂场景中流动人群的分布与计数检测的方法另一实施例中的人群检测效果分析示意图;图7是根据本专利技术复杂场景中流动人群的分布与计数检测的方法另一实施例中的人群检测效果分析示意图。具体实施方式为了便于理解本专利技术,下面结合附图和具体实施例,对本专利技术进行更详细的说明。附图中给出了本专利技术的较佳的实施例。但是,本专利技术可以以许多不同的形式来实现,并不限于本说明书所描述的实施例。相反地,提供这些实施例的目的是使对本专利技术的公开内容的理解更加透彻全面。需要说明的是,除非另有定义,本说明书所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。在本专利技术的说明书中所使用的术语只是为了描述具体的本文档来自技高网
...

【技术保护点】
1.一种复杂场景中流动人群的分布与计数检测的方法,其特征在于,包括以下步骤:构建预训练模型,构建一单列卷积神经网络BLCNN模型,利用公开数据集提供的原始图像作为输入,以所述原始图像中对应的人群标注文件作为输出,对所述BLCNN模型进行训练,得到预训练模型;多层网络初始化,利用所述预训练模型对多层卷积神经网络MLCNN网络初始化,所述MLCNN网络包括由所述预训练模型构成的第一层网络,以及在所述第一层网络之后并行分开的感知支路网络和融合支路网络;特征提取与感知,将待识别图像输入到所述第一层网络提取特征信息,所述特征信息进一步输入到感知支路网络得到感知信息,所述感知信息还输入到所述融合支路网络进行信息融合;融合估算人群数量,所述特征信息还输入到融合支路网络,并利用所述感知信息进行信息融合和密度估算,得到所述待识别图像中对应的人群数量。

【技术特征摘要】
1.一种复杂场景中流动人群的分布与计数检测的方法,其特征在于,包括以下步骤:构建预训练模型,构建一单列卷积神经网络BLCNN模型,利用公开数据集提供的原始图像作为输入,以所述原始图像中对应的人群标注文件作为输出,对所述BLCNN模型进行训练,得到预训练模型;多层网络初始化,利用所述预训练模型对多层卷积神经网络MLCNN网络初始化,所述MLCNN网络包括由所述预训练模型构成的第一层网络,以及在所述第一层网络之后并行分开的感知支路网络和融合支路网络;特征提取与感知,将待识别图像输入到所述第一层网络提取特征信息,所述特征信息进一步输入到感知支路网络得到感知信息,所述感知信息还输入到所述融合支路网络进行信息融合;融合估算人群数量,所述特征信息还输入到融合支路网络,并利用所述感知信息进行信息融合和密度估算,得到所述待识别图像中对应的人群数量。2.根据权利要求1所述的复杂场景中流动人群的分布与计数检测的方法,其特征在于,所述预训练模型包括依次串联的两个层级:VGG-G5层级和Shared-Net层级,在所述VGG-G5层级中又进一步包括依次串联的五级卷积池化层,均采用了3×3的卷积核和2×2的池化层。3.根据权利要求2所述的复杂场景中流动人群的分布与计数检测的方法,其特征在于,所述五级卷积池化层对于的第一级卷积池化层包括64个3×3的卷积核,且由两组3×3×64的卷积核堆叠而成;第二级卷积池化层包括128个3×3的卷积核,且由两组3×3×128的卷积核堆叠而成;第三级卷积池化层包括256个3×3的卷积核,且由三组3×3×256的卷积核堆叠而成;第四级卷积池化层包括512个3×3的卷积核,且由三组3×3×512的卷积核堆叠而成;第五级卷积池化层包括512个3×3的卷积核,且由两组3×3×512的卷积核堆叠而成。4.根据权利要求2或3所述的复杂场景中流动人群的分布与计数检测的方法,其特征在于,所述Shared-Net层级进一步包括依次串联的卷积层和反卷积层:第一卷积层为1×1×256卷积层,第二反卷积层为2×2×128的反卷积层,第三卷积层为3×3×128卷积层,...

【专利技术属性】
技术研发人员:姜晓恒崔高歌徐明亮吕培郭毅博王华李亚飞朱睿杰周兵
申请(专利权)人:郑州大学
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1