一种基于固定型单目摄像头的多目标行人实时检测定位方法技术

技术编号:37295327 阅读:17 留言:0更新日期:2023-04-21 22:42
本发明专利技术涉及人工智能视觉算法及室内定位技术领域,具体涉及一种基于固定型单目摄像头的多目标行人实时检测定位方法;本发明专利技术通过人工智能视觉算法自动标定出行人头部检测框,并根据检测框在图像中的位置及像素信息,结合摄像头内外参数计算出行人的实时坐标。本发明专利技术所述的方法所需要的先验知识较少,并且与摄像头安装角度无关,所需外参易于测量,精度受摄像头畸变影响较小。同时采用人体头部检测框进行计算,避免了不同体型人体带来的计算误差。本发明专利技术不需要双目测距那样需要特征点匹配这一麻烦的过程,也无需事先对场地进行标定,计算量低,实时性强,精度相对较好,测距范围50米左右时的误差基本可以控制在1米以内。右时的误差基本可以控制在1米以内。右时的误差基本可以控制在1米以内。

【技术实现步骤摘要】
一种基于固定型单目摄像头的多目标行人实时检测定位方法


[0001]本专利技术涉及人工智能视觉算法及室内定位
,具体涉及一种基于固定型单目摄像头的多目标行人实时检测定位方法。

技术介绍

[0002]近年来,随着卷积神经网络技术的发展、开源数据集的兴起以及硬件设备计算力的提升,基于卷积神经网络的目标检测算法得到突破性发展。
[0003]基于深度学习的一阶段Anchor base方法,其基本原理是将输入图像输入到特征提取网络之中,得到一定大小的特征图,然后将特征图划分成多个网格单元,为每一个网格同时预测边界框并给出相应概率,最后通过非极大值抑制技术去除冗余窗口,从而检测出最终的目标。这种方法将目标检测任务转换成一个回归问题,从而大大加快了检测的速度,但同时会降低检测精度。
[0004]目前,国内大型公共交通场景安装有大量摄像头设备,其采集的视觉数据可应用于多种行人识别和态势分析。然而目前基于视觉的行人检测技术大多关注行人的识别和分类,并没有同时对行人进行精确的空间定位。即便是区域入侵、绊线入侵等检测技术,也是基于屏幕坐标系下的行人位置进行判断,而非基于行人真实空间位置,无法应用于基于真实地理位置的可视化GIS平台。
[0005]现有基于单目摄像头的行人定位算法,大多需要对目标场景的多个参考点进行提前标定,实施流程复杂,对空间平整度要求高,可行性较低。

技术实现思路

[0006]本专利技术要解决的技术问题在于:现有通用目标检测技术中摄像头采集的视频数据的检测结果只能标识行人所在区域,无法准确定位行人所在位置;而现有的基于单目摄像头的行人定位技术,又需要对摄像头和场地进行繁杂的标定。本专利技术提供一种简单实用的基于固定型单目摄像头的多目标行人实时检测定位方法,所需内参易于获得,无需复杂的标定流程,也不需要如双目测距方法进行特征点匹配,算法实时性强,定位精确,环境适应性强。
[0007]为实现上述目的,本专利技术提供了如下技术方案:
[0008]一种基于固定型单目摄像头的多目标行人实时检测定位方法,其中,所述基于固定型单目摄像头的多目标行人实时检测定位方法包括:
[0009]通过固定型单目摄像头的设备参数,获取摄像头的水平广角、垂直广角,并通过测量获取摄像头的安装高度及世界坐标系下的变换矩阵;
[0010]下载行人相关图像,使用标注工具制作标定人体头部的专用数据集,并将此数据集送入深度学习神经网络进行训练,得到一个用于行人头部检测的模型并部署于服务器端;
[0011]采集摄像头拍摄的视频图像序列并实时传输至服务器;
[0012]通过基于深度学习神经网络的目标检测算法,将图像缩放为固定像素图像,并检测出行人头部,获得头部检测框中心点像素坐标及头部检测框的像素宽度和高度,根据上述信息,计算出检测框在镜头视野中的夹角以及检测框中心点横向偏离镜头光轴的角度;
[0013]根据先验知识设定人体头部宽度和高度数值的平方均值,根据上一步骤得出的数据,计算出行人在以摄像头为坐标原点的坐标系下的坐标;
[0014]根据上一步计算出的行人坐标和摄像头的世界坐标,通过线性变换计算出行人的世界坐标。
[0015]此外,本专利技术还提供了一种基于固定型单目摄像头的多目标行人实时检测定位系统,其中,所述的基于固定型单目摄像头的多目标行人实时检测定位系统包括:
[0016]训练部署模块,用于训练行人头部检测模型,并将所述模型部署于服务器;
[0017]数据传输模块,用于将摄像头获取的实时视频数据传输至服务器;
[0018]视频推理模块,用于读取摄像头传输至服务器的视频流,并将视频流按帧分解为图像信息,将图像缩放为固定像素,并检测出行人头部,获得头部检测框中心点像素坐标及头部检测框的像素宽度和高度信息;
[0019]角度计算模块,用于将所述行人头部检测模型获得的头部检测框中心点像素坐标及头部检测框的像素宽度和高度信息,计算出检测框在镜头视野中的夹角以及检测框中心点横向偏离镜头光轴的角度;
[0020]距离计算模块,用于将检测框在镜头视野中的夹角以及检测框中心点横向偏离镜头光轴的角度,结合根据先验知识设定的人体头部宽度和高度数值的平方均值和摄像头的安装高度,计算出行人距摄像头的水平距离,以及行人距摄像头光轴的垂直距离;
[0021]坐标计算模块,用于通过所述行人距摄像头的水平距离和行人距摄像头光轴的垂直距离,以及所述摄像头世界坐标系下的变换矩阵,通过线性变换计算出行人在世界坐标系下的坐标。
[0022]有益效果
[0023]采用本专利技术提供的技术方案,与已知的公有技术相比,具有如下有益效果:
[0024](1)本专利技术基于固定型单目摄像头的多目标行人实时检测定位方法,解决了视觉检测任务中对目标进行分类检测的同时,如何获得行人真实空间位置的问题,可应用于多目标轨迹跟踪等领域;
[0025](2)本专利技术方法实践效果较好,运行速度快,算法鲁棒性好,可适用于多样性高的复杂场景,可以实时、快速、准确的实现对目标行人的定位和跟踪,适用于视频监控、智能小区、特定场所监管等众多领域;
[0026](3)本专利技术用于实现行人定位的技术路线落地方便,相较于现有的其他定位技术,可直接利用现有摄像头设施,无需额外施工,易于推广普及。
附图说明
[0027]图1是本专利技术基于固定型单目摄像头的多目标行人实时检测定位方法的流程图;
[0028]图2是本专利技术基于固定型单目摄像头的多目标行人实时检测定位方法的较佳实施例的流程图;
[0029]图3是本专利技术基于固定型单目摄像头的多目标行人实时检测定位方法的较佳实施
例中步骤S4的角度计算方法示意图;
[0030]图4是本专利技术基于固定型单目摄像头的多目标行人实时检测定位方法的较佳实施例中步骤S5和步骤S6的行人坐标计算示意图。
具体实施方式
[0031]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将对本专利技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0032]下面结合实施例对本专利技术作进一步的描述。
[0033]实施例:
[0034]本专利技术提供了一种基于固定型单目摄像头的多目标行人实时检测定位方法。
[0035]如图1

2所示,根据本专利技术实施例的基于固定型单目摄像头的多目标行人实时检测定位方法,包括以下步骤:
[0036]步骤S1,通过固定型单目摄像头的设备参数,获取摄像头的水平广角A、垂直广角B,并通过测量获取摄像头的安装高度H及世界坐标系下的变换矩阵P;
[0037]步骤S2,下载行人相关图像,使用标注工具制作标定人体头部的专用数据集,并将此数据集送入深度学习神经网络进行训练,得到一个用于行人本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于固定型单目摄像头的多目标行人实时检测定位方法,其特征在于,包括以下步骤:(1)通过固定型单目摄像头的设备参数,获取摄像头的水平广角、垂直广角,并通过测量获取摄像头的安装高度及世界坐标系下的变换矩阵;(2)下载行人相关图像,使用标注工具制作标定人体头部的专用数据集,并将此数据集送入深度学习神经网络进行训练,得到一个用于行人头部检测的模型并部署于服务器端;(3)采集摄像头拍摄的视频图像序列,并将图像缩放为固定像素图像,通过步骤(2)的算法检测出行人头部,获得头部检测框中心点像素坐标及头部检测框的像素宽度和高度,并根据上述信息,计算出检测框在镜头视野中的夹角以及检测框中心点横向偏离镜头光轴的角度;(4)根据先验知识设定人体头部宽度和高度数值的平方均值,根据步骤(1)、(3)得出的数据,计算出行人在以摄像头为坐标原点的坐标系...

【专利技术属性】
技术研发人员:万超颖韩仲
申请(专利权)人:苏州加乘科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1