当前位置: 首页 > 专利查询>南京大学专利>正文

一种基于深度学习的人物定位方法技术

技术编号:27939129 阅读:59 留言:0更新日期:2021-04-02 14:20
本发明专利技术公开了一种基于深度学习的人物定位方法,包括:获取数据集并通过类别标签对数据集进行筛选处理,训练获得深度学习模型;在待识别场景中配置摄像头,并选择并获取边界点在图像中的像素坐标、在待识别场景中的仿射后的像素坐标和实际坐标;计算坐标转换矩阵和线性关系函数;利用深度学习模型对摄像头采集的图像进行人物检测,获得人物像素坐标;通过坐标转换矩阵得到人物仿射后的像素坐标,根据线性关系函数换算得到人物实际坐标;输出并实时显示人物定位结果,包括人物图像选框和人物实际坐标。采用前述方法,能够精准判断待识别场景中人物的同时,实时显示人物坐标,相较于现有技术运行速度得到显著提升。

【技术实现步骤摘要】
一种基于深度学习的人物定位方法
本专利技术涉及计算机视觉领域,尤其涉及一种基于深度学习的人物定位方法。
技术介绍
近年来,随着计算机视觉领域的迅速发展和计算机科学技术水平的提高,通过计算机对人物进行检测和定位逐渐进入了大众的视野。无论是对于超市等大型公共场所的整体监控,还是对于工厂工地等生产经营场所内工作人员的活动范围检测,亦或是对于各种场所的安防监控,都有着极大的帮助。因此,有效确定人物的位置在计算机视觉领域具有良好的发展前景。目前,针对目标检测的主流研究很多,也取得了丰硕的成果。但是将目标检测用于实时定位却鲜有人提出。目前主流的人物定位技术包括电子标签定位技术、图像处理定位技术以及红外线感知技术。电子标签定位技术需要专员佩戴相应的电子标签,然后通过内网传输电子标签信息到服务器上对专员进行实时定位,通过电子标签定位技术进行人物定位的定位较为准确,且实时性好,但是实现该定位技术需要有内网支持,且电子标签造价高,导致技术成本较大。而图像处理定位技术,一般通过首先对录制的监控画面进行逐帧处理,再通过膨胀腐蚀等基础图像处理方法对图像进行处理,最后利用表征分类对判定为人物这一类别的位置进行显示,通过图像处理定位技术进行人物定位的计算速度较快,但是其定位精度往往达不到要求。至于红外感知技术,通过在对象身上附着发射红外线的标签,通过在安放多个红外传感器确定信号源和传感器之间的距离和角度,达到人物定位的目的,通过红外线感知技术进行人物定位的定位方式受环境影响较大,尤其是在有遮挡的情况下信号无法传输,而且信号传输距离也较短。因此,需要一种人物定位方法,以解决现有的各种人物定位方法中定位设备造价高、定位精度较低、受到环境的影响较大以及信号传输距离较短,导致人物定位效果较差的问题。
技术实现思路
本专利技术提供了一种基于深度学习的人物定位方法,以解决现有的各种人物定位方法中定位设备造价高、定位精度较低、受到环境的影响较大以及信号传输距离较短,导致人物定位效果较差的问题。为了解决上述技术问题,本专利技术公开了一种基于深度学习的人物定位方法,该方法可以用于定向监控,目标定位,安防工程等应用中,一种基于深度学习的人物定位方法,包括如下步骤:步骤1,获取数据集,通过类别标签对所述数据集进行筛选处理,使筛选处理后的数据集包含人物类别,利用所述筛选处理后的数据集训练获得深度学习模型;步骤2,在待识别场景中配置摄像头,并选择所述待识别场景中的边界点,获取所述边界点在图像中的像素坐标、在待识别场景中的仿射后的像素坐标和在识别场景中的实际坐标,所述图像通过摄像头采集,所述边界点为至少三个不在一条直线上的点;步骤3,根据所述边界点在图像中的像素坐标和在待识别场景中的仿射后的像素坐标计算坐标转换矩阵,根据所述在待识别场景中的仿射后的像素坐标和在待识别场景中的实际坐标计算线性关系函数;步骤4,利用训练得到的深度学习模型对所述摄像头采集的图像进行人物检测,获得人物像素坐标;步骤5,通过所述坐标转换矩阵将人物像素坐标换算得到人物仿射后的像素坐标,根据所述线性关系函数将人物仿射后的像素坐标换算得到人物实际坐标;步骤6,输出并实时显示人物定位结果,所述人物定位结果包括人物图像选框和人物实际坐标。进一步地,在一种实现方式中,在所述步骤2之前,还包括:根据所述待识别场景建立二维坐标系,所述二维坐标系的坐标轴为待识别场景中的两条互相垂直的场景边界线。进一步地,在一种实现方式中,所述步骤3包括:所述坐标转换矩阵为:其中,x为边界点在图像中的像素横坐标,y为边界点在图像中的像素纵坐标,则(x,y)为边界点在图像中的像素坐标,xp为边界点在待识别场景中的仿射后的像素横坐标,yp为边界点在待识别场景中的仿射后的像素纵坐标,则(xp,yp)为边界点在待识别场景中的仿射后的像素坐标,所述边界点在图像中的像素坐标与边界点在待识别场景中的仿射后的像素坐标一一对应;所述线性关系函数为:其中,(x0,y0)为边界点在待识别场景中的实际坐标,(x1,y1)和(x2,y2)分别为选取用于仿射变换的两点的实际坐标,(xp0,yp0)为边界点仿射变换后的像素坐标,(xp1,yp1)和(xp2,yp2)为选取用于仿射变换的两点仿射变换后的像素坐标;所述边界点在待识别场景中的仿射后的像素坐标与边界点在待识别场景中的实际坐标一一对应。进一步地,在一种实现方式中,所述步骤4包括:步骤4-1,对所述训练得到的深度学习模型设定预设阈值;步骤4-2,将所述训练得到的深度学习模型预测获得的人物类别出现概率与预设阈值进行比对,获得比对结果;若选框中的所述人物类别出现概率大于或等于预设阈值,则所述比对结果为所述选框中存在待定位人物,所述选框通过训练得到的深度学习模型在图像中预先拟定;若所述选框中的人物类别出现概率小于预设阈值,则所述比对结果为选框中不存在待定位人物;步骤4-3,若所述比对结果为选框中存在待定位人物,则通过所述训练得到的深度学习模型获得人物在图像中的像素坐标,并拟合所述选框后在图像中输出人物图像选框,所述人物在图像中的像素坐标包括左上坐标(x0,y0)和右下坐标(x1,y1)构成的框选区域,所述人物图像选框即存在待定位人物的选框,即由(x0,y0)、(x0,y1)、(x1,y0)和(x1,y1)四个坐标构成的矩形框;若所述比对结果为选框中不存在待定位人物,则舍弃所述选框。进一步地,在一种实现方式中,所述步骤5包括:步骤5-1,若所述图像中存在待定位人物,根据所述人物在图像中的左上坐标(x0,y0)和右下坐标(x1,y1),计算所述人物落脚点的像素坐标步骤5-2,根据以下公式,通过所述坐标转换矩阵计算人物落脚点的仿射后的像素坐标,即所述人物仿射后的像素坐标:步骤5-3,根据以下公式,通过线性关系函数计算人物实际坐标:进一步地,在一种实现方式中,所述步骤6包括:将所述待定位人物的人物图像选框与人物仿射后的像素坐标(x′,y′)作为定位结果输出,与所述图像实时显示。进一步地,在一种实现方式中,所述定位结果还包括人物类别出现概率。有益效果:本专利技术的显著优点是利用深度学习的精确性以及仿射变换的普适性做到既精准判断人物存在同时运行速度较快能够实时显示人物坐标,并且对于房间内有多个人存在的情况下依然表现良好,适合监控人物以及检测人物活动范围,算法性能优良。附图说明为了更清楚地说明本专利技术的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例部分提供的一种基于深度学习的人物定位方法的工作流程示意图;图2a是本专利技术实施例部分提供的一种基于深度学习的人物定位方法中第一中间结果示意图;图2b是本专利技术实施例部分提本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的人物定位方法,其特征在于,包括如下步骤:/n步骤1,获取数据集,通过类别标签对所述数据集进行筛选处理,使筛选处理后的数据集包含人物类别和其他类别,利用所述筛选处理后的数据集训练获得深度学习模型;/n步骤2,在待识别场景中配置摄像头,并选择所述待识别场景中的边界点,获取所述边界点在图像中的像素坐标、在待识别场景中的仿射后的像素坐标和在识别场景中的实际坐标,所述图像通过摄像头采集,所述边界点为至少三个不在一条直线上的点;/n步骤3,根据所述边界点在图像中的像素坐标和在待识别场景中的仿射后的像素坐标计算坐标转换矩阵,根据所述在待识别场景中的仿射后的像素坐标和在待识别场景中的实际坐标计算线性关系函数;/n步骤4,利用训练得到的深度学习模型对所述摄像头采集的图像进行人物检测,获得人物像素坐标;/n步骤5,通过所述坐标转换矩阵将人物像素坐标换算得到人物仿射后的像素坐标,根据所述线性关系函数将人物仿射后的像素坐标换算得到人物实际坐标;/n步骤6,输出并实时显示人物定位结果,所述人物定位结果包括人物图像选框和人物实际坐标。/n

【技术特征摘要】
1.一种基于深度学习的人物定位方法,其特征在于,包括如下步骤:
步骤1,获取数据集,通过类别标签对所述数据集进行筛选处理,使筛选处理后的数据集包含人物类别和其他类别,利用所述筛选处理后的数据集训练获得深度学习模型;
步骤2,在待识别场景中配置摄像头,并选择所述待识别场景中的边界点,获取所述边界点在图像中的像素坐标、在待识别场景中的仿射后的像素坐标和在识别场景中的实际坐标,所述图像通过摄像头采集,所述边界点为至少三个不在一条直线上的点;
步骤3,根据所述边界点在图像中的像素坐标和在待识别场景中的仿射后的像素坐标计算坐标转换矩阵,根据所述在待识别场景中的仿射后的像素坐标和在待识别场景中的实际坐标计算线性关系函数;
步骤4,利用训练得到的深度学习模型对所述摄像头采集的图像进行人物检测,获得人物像素坐标;
步骤5,通过所述坐标转换矩阵将人物像素坐标换算得到人物仿射后的像素坐标,根据所述线性关系函数将人物仿射后的像素坐标换算得到人物实际坐标;
步骤6,输出并实时显示人物定位结果,所述人物定位结果包括人物图像选框和人物实际坐标。


2.根据权利要求1所述的一种基于深度学习的人物定位方法,其特征在于,在所述步骤2之前,还包括:
根据所述待识别场景建立二维坐标系,所述二维坐标系的坐标轴为待识别场景中的两条互相垂直的场景边界线。


3.根据权利要求1所述的一种基于深度学习的人物定位方法,其特征在于,所述步骤3包括:
所述坐标转换矩阵为:



其中,x为边界点在图像中的像素横坐标,y为边界点在图像中的像素纵坐标,则(x,y)为边界点在图像中的像素坐标,xp为边界点在待识别场景中的仿射后的像素横坐标,yp为边界点在待识别场景中的仿射后的像素纵坐标,则(xp,yp)为边界点在待识别场景中的仿射后的像素坐标,所述边界点在图像中的像素坐标与边界点在待识别场景中的仿射后的像素坐标一一对应;
所述线性关系函数为:



其中,(x0,y0)为边界点在待识别场景中的实际坐标,(x1,y1)和(x2,y2)分别为选取用于仿射变换的两点的实际坐标,(xp0,yp0)为边界点仿射变换后的像素坐标,(xp1,yp...

【专利技术属性】
技术研发人员:申富饶董学文赵健李俊
申请(专利权)人:南京大学南京和光智能制造研究院有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1