一种基于计算机视觉技术的人群流量多方向计数方法技术

技术编号：40015359 阅读：9 留言：0更新日期：2024-01-16 15:55

本发明专利技术提供了一种基于计算机视觉技术的人群流量多方向计数方法。该方法包括：基于YOLOv5和DeepSORT方法对相机拍摄的视频数据进行头部检测和跟踪，提取出相机坐标系中的行人的运动轨迹；利用相机坐标系到世界坐标系的转换矩阵将所述相机坐标系中的行人的运动轨迹转换成世界坐标系中的行人的运动轨迹；通过IO匹配方法根据所述世界坐标系中的行人的运动轨迹进行人群计数统计，获取所述视频数据的多方向人群流量结果。本发明专利技术方法有效地解决了传统人群流量计数方法存在的问题，适用于高密度人群场景，有效解决了高密度人群计数的遮挡跟踪问题，它在保证高检测精度的前提下提高了实时计算效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人群统计，尤其涉及一种基于计算机视觉技术的人群流量多方向计数方法。

技术介绍

1、随着经济的发展，城市人口迅速增长，密集人群频繁引发踩踏事件，高密度人群人数统计信息对公共安全有重要意义。对人群聚集区域进行多方向流量计数与分析，以便更好地了解人群活动的规律和趋势，可以为城市规划、公共安全、交通管理、商业决策等方面提供数据支持。然而，目前大部分客流计数技术主要适用于低密度、低流量场景，并且由于视频重叠问题，难以实现多方向的精确计数。

2、目前，传统的公共交通客流计数方法是通过人工计数，通常要耗费大量人力物力，并且难以实现实时计数。经过科学技术的发展，利用红外传感器和脚踏垫传感器等可以实现公共交通的自动计数；该方法减少了人力，提高了计数效率。

3、随着计算机技术的进步，出现了基于计算机视觉的人群计数方法。第一类方法是基于个体特征检测来估计人群数，使用滑动检测器遍历图像得到行人全身特征，进而识别行人个体进行人群流量计数。考虑到人群中的个体重叠问题，出现了基于局部部位检测计数的方法，如通过注水算法检测深度图像移动区域的人头数目估算人数、通过建立多视图头肩模型进行人群计数。第二类是基于回归的方法，跳过检测步骤，直接学习从图像到计数结果的映射，通过特征提取和回归建模展开。特征提取包括前景提取、像素统计、纹理提取、边缘提取等。特征被提取出来后，采用不同回归技术，如线性回归、分段线性回归、岭回归、高斯过程回归和神经网络来学习从低级特征到人群数量的映射。

4、随着深度学习技术的出现，cnn(conv

5、上述现有技术中的公共交通客流计数方法的缺点包括：

6、目前传统的人群客流计数方法主要用于低密度、低流量客流统计，难以实现高密度人群的实时计数。

7、针对基于计算机视觉技术的技术方法，基于回归的方法可以用于高密度人群计数，但是主要用于静态图像中，难以用于视频中的移动人群；基于个体特征检测的方法难以处理高密度人群中的个体遮挡问题，因此，对于高密度人群流量计数精度不高。

技术实现思路

1、本专利技术的实施例提供了一种基于计算机视觉技术的人群流量多方向计数方法，以实现有效地对视频数据进行多方向人群流量检测。

2、为了实现上述目的，本专利技术采取了如下技术方案。

3、一种基于计算机视觉技术的人群流量多方向计数方法，包括：

4、基于yolov5和deepsort方法对相机拍摄的视频数据进行头部检测和跟踪，提取出相机坐标系中的行人的运动轨迹；

5、利用相机坐标系到世界坐标系的转换矩阵将所述相机坐标系中的行人的运动轨迹转换成世界坐标系中的行人的运动轨迹；

6、通过io匹配方法根据所述世界坐标系中的行人的运动轨迹进行人群计数统计，获取所述视频数据的多方向人群流量结果。

7、优选地，所述的基于yolov5和deepsort方法对相机拍摄的视频数据进行头部检测和跟踪，提取出相机坐标系中的行人的运动轨迹，包括：

8、提取待统计的视频数据中的各个图像帧，通过yolo算法将各个图像帧调整为正方形大小，并将调整后的图像划分为多个网格单元格，基于卷积神经网络对每个单元格预测包围框，该包围框是由中心点的x坐标和y坐标、宽度w和高度h确定的矩形框，用置信度分数conf标记被检测对象，每个预测的包围框包含5个值：(x,y,w,h,conf)，置信度分数conf由公式(1)计算，采用非最大抑制算法获取置信度分数conf高于阈值的包围框，该包围框即为检测到的行人包围框；

9、

10、其中，p(object)是物体存在于单元中的概率，如果单元格中不存在对象，conf为0；否则，conf等于预测框和ground truth之间的iou交集；

11、将检测到的行人包围框、相应的置信度分数和特征输入deep sort模块，deepsort模块利用匹配级联算法对确认的轨迹进行匹配，在匹配时计算预测的kalman轨迹与新检测到的轨迹之间的距离以及外观特征的相似度，得到加权相似度，将加权相似度输入到匈牙利算法中，得到匹配矩阵，最后利用匹配阈值max_threshold获取匹配的轨迹，将该匹配的轨迹作为行人连续的空间运动轨迹。

12、优选地，所述的方法还包括：

13、每个网格单元还预测了被检测对象object的作为class类物体的条件概率p，每个包围框的类别特定置信度分数confc由公式(2)计算。

14、

15、优选地，所述的利用相机坐标系到世界坐标系的转换矩阵将所述相机坐标系中的行人的运动轨迹转换成世界坐标系中的行人的运动轨迹，包括：

16、设置相机的外部参数包括旋转矩阵r和平移向量t，相机坐标系中的点pc(xc,yc,zc)通过外部参数变换为世界坐标系中的点pw(xw,yw,zw)，转换公式如公式(3)所示：

17、

18、对于针孔相机，点pc(xc,yc,zc)遵循相似三角形规则到图像平面上的点p(x,y)的投影，如公式(4)左式所示，点pw(xw,yw,zw)在图像分辨率像素坐标系中变换为pi(u,v)，如公式(4)右式所示：

19、

20、在公式(4)中，f为焦距，dx、dy是一个像素的长度，u0、v0是光学中心；

21、对以上方程进行积分，得到相机的本征矩阵k，包含四个内在参数，如公式(5)所示：

22、

23、对于广角相机，点的位置在投影到像面上时会发生畸变，点pc被扭曲为点p'(x',y')，如公式(6)、(7)所示：

24、θd＝θ+k1θ3+k2θ5+k3θ7+k4θ9 (6)

25、

26、式中k1-4为畸变参数，θ为主轴与入射射线的夹角，θd为主轴与投影射线的夹角：

27、基于相机的本征矩阵k和畸变参数，利用公式(3)-(7)即可实现相机坐标系中的点变换为世界坐标系中的点，从而本文档来自技高网...

【技术保护点】

1.一种基于计算机视觉技术的人群流量多方向计数方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述的基于YOLOv5和DeepSORT方法对相机拍摄的视频数据进行头部检测和跟踪，提取出相机坐标系中的行人的运动轨迹，包括：

3.根据权利要求1所述的方法，其特征在于，所述的方法还包括：

4.根据权利要求2或者3所述的方法，其特征在于，所述的利用相机坐标系到世界坐标系的转换矩阵将所述相机坐标系中的行人的运动轨迹转换成世界坐标系中的行人的运动轨迹，包括：

5.根据权利要求4所述的方法，其特征在于，所述的通过IO匹配方法根据所述世界坐标系中的行人的运动轨迹进行人群计数统计，获取所述视频数据的多方向人群流量结果，包括：

6.根据权利要求5所述的方法，其特征在于，所述的方法还包括：

【技术特征摘要】

1.一种基于计算机视觉技术的人群流量多方向计数方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述的基于yolov5和deepsort方法对相机拍摄的视频数据进行头部检测和跟踪，提取出相机坐标系中的行人的运动轨迹，包括：

3.根据权利要求1所述的方法，其特征在于，所述的方法还包括：

4.根据权利要求2或者3所述的方法，其...

【专利技术属性】
技术研发人员：朱亚迪，陈峰，李小红，李萍，王子甲，
申请(专利权)人：北京交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人