一种获取视频中人群空间位置的方法技术

技术编号：23558714 阅读：24 留言：0更新日期：2020-03-25 04:11

本发明专利技术提出一种获取视频中人群空间位置的方法，属于城市空间分析技术领域。该方法首先获取待分析空间视频，并提取相应的图像；利用卷积神经网络模型对每张图像进行目标检测；对目标检测结果中保留识别结果为人的目标识别框，利用几何算法将每张图像中人的位置还原为平面图或俯视图中的坐标，得到视频中人群空间位置信息。本发明专利技术具有能够快速、准确的获取人群的实际地理位置信息的优点，且在城市空间分析和城乡规划评估等方面有较好的应用前景。

A method to get the spatial position of people in video

全部详细技术资料下载

【技术实现步骤摘要】
一种获取视频中人群空间位置的方法
本专利技术属于城市空间分析
，特别提出一种获取视频中人群空间位置的方法。
技术介绍
信息
的不断发展为大规模的数据处理提供了条件，特别是近年来深度学习技术的发展极大地推动了计算机视觉领域的研究，使得从常见的录影设备中获得的数据，如照片、视频等，有了新的分析手段。视频图像中蕴含了非常丰富的环境特征和人群行为信息，利用视频分析人群行为可以帮助我们更直观地理解人群的行为特征。如果能够获取视频中人群空间位置，将极大的提升城市空间分析的精度和效率。现有的通过视频获取人群信息的方法为，在研究区域内布置监控摄像头，并使用卷积神经网络中的目标检测算法，对监控摄像头所录视频内人群行为进行分析。在此基础上通过将人群信息使用热力图形式进行可视化，可获取人群对于空间的使用情况。目前通过视频获取的人群信息仅能在显示视频中人群位置，而无法将人群信息精确转换至实际的地理空间中。这是由于目前图像处理中使用的透视法无法还原因为透视导致的空间变形。以现有的图像变现方法为例，对于一个形状为正方形的广场，其四个顶点A、B、C、D的投影坐标分别为[0,0]、[0,1]、[1,1]和[1,0]，其中点E的坐标为[0.5,0.5]。假设在使用摄像设备对广场进行拍摄后，正方形的广场根据单点透视的原理变形为梯形，顶点A、B、C、D在图像上的坐标变为[0,0]、[0,1]、[0.8,0.6]和[0.2,0.6]，通过对角线交点法可知中点E的坐标变为[0.5,0.375]。现在Photoshop等图像软件使用...

【技术保护点】
1.一种获取视频中人群空间位置的方法，其特征在于，包括以下步骤：/n1)获取待分析空间视频；/n获取反映待分析空间中人群活动的待分析空间视频，所述视频无镜头失真、拍摄视角固定、视频覆盖完整的待分析空间、视频中在待分析空间中活动的人为完整图像且视频中人的像素值大于2像素；视频长度不小于15分钟；/n2)从步骤1)获取的视频中提取图像；/n按照设定的帧数间隔从步骤1)获取的视频中提取图像；所述帧数间隔计算表达式如下：/nTI＝GW/AS*FN/n其中，TI为帧数间隔；GW为待分析空间对应的平面图或俯视图中分析网格的边长，AS为人平均运动速度，FN为视频拍摄帧率；/n3)利用卷积神经网络模型对步骤2)得到的每张图像进行目标检测；/n利用ssd_resnet_50_fpn作为目标检测的卷积神经网络模型，所述模型的输入是步骤2)得到的每张图像，模型的输出包括：输入图像对应的识别范围，该图像中每个识别范围的置信度，每个识别范围中目标的类别以及该图像对应的帧数序号；其中每个识别范围对应一个目标识别框，每个识别范围包含四个数值，分别代表在输入图像目标识别平面直角坐标系下该识别范围对应的目标识别框的左下...

【技术特征摘要】
1.一种获取视频中人群空间位置的方法，其特征在于，包括以下步骤：
1)获取待分析空间视频；
获取反映待分析空间中人群活动的待分析空间视频，所述视频无镜头失真、拍摄视角固定、视频覆盖完整的待分析空间、视频中在待分析空间中活动的人为完整图像且视频中人的像素值大于2像素；视频长度不小于15分钟；
2)从步骤1)获取的视频中提取图像；
按照设定的帧数间隔从步骤1)获取的视频中提取图像；所述帧数间隔计算表达式如下：
TI＝GW/AS*FN
其中，TI为帧数间隔；GW为待分析空间对应的平面图或俯视图中分析网格的边长，AS为人平均运动速度，FN为视频拍摄帧率；
3)利用卷积神经网络模型对步骤2)得到的每张图像进行目标检测；
利用ssd_resnet_50_fpn作为目标检测的卷积神经网络模型，所述模型的输入是步骤2)得到的每张图像，模型的输出包括：输入图像对应的识别范围，该图像中每个识别范围的置信度，每个识别范围中目标的类别以及该图像对应的帧数序号；其中每个识别范围对应一个目标识别框，每个识别范围包含四个数值，分别代表在输入图像目标识别平面直角坐标系下该识别范围对应的目标识别框的左下角X坐标、左下角Y坐标、右上角X坐标和右上角Y坐标，记为(Xa，Ya，Xc，Yc)，每个坐标值取值范围均为0至1；其中，所述目标识别平面直角坐标系的原点为图像左上角顶点，X轴从上至下取值范围为0到1，Y轴从左至右取值范围为0到1；
4)利用几何算法将每张图像中人的位置还原为平面图或俯视图中的坐标，得到步骤1)获取的视频中人群空间位置信息；具体步骤如下：
4-1)利用步骤3)的结果，对每张图像，保留卷积神经网络模型输出中目标类别为1的目标识别框；
4-2)获取待分析空间的平面图或俯视图，在平面图或俯视图中，建立待分析空间最小包络正方形，该正方形的四个顶点分别记为左下角顶点PA、右下角顶点PB、右上角顶点PC和左上角顶点PD；采用平面图或俯视图的分析网格平面直角坐标系分别标记PA、PB、PC和PD的X、Y坐标；其中，所述平面图或俯视图的分析网格平面直角坐标系原点为该...

【专利技术属性】
技术研发人员：侯静轩，龙瀛，陈龙，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人