基于机器视觉和深度学习的目标检测方法技术

技术编号:20026413 阅读:41 留言:0更新日期:2019-01-06 05:11
本发明专利技术公开了一种基于机器视觉和深度学习的目标检测方法,包括获取待检测目标的图像;对图像的各个边界框进行回归并预测相应类别的概率,并检测和优化;对目标间的中心空间位置进行计算,完成目标的检测。本发明专利技术提供的这种基于机器视觉和深度学习的目标检测方法,采用对图片进行直接识别的方式对图片的特征进行提取,因此本发明专利技术方法能够快速的对目标物体进行检测和定位,而且本发明专利技术方法简单可靠。

【技术实现步骤摘要】
基于机器视觉和深度学习的目标检测方法
本专利技术具体涉及一种基于机器视觉和深度学习的目标检测方法。
技术介绍
随着智能化时代的到来,智能机器人技术的发展已经越来越快。在智能机器人
中,机器视觉则是一个关键所在。目标检测是计算机视觉领域一个关键问题,同时更是安防机器人的研究重点之一。目前为止,机器人安防工作过程中需要判定环境是否异常,而这一判定过程需要计算机视觉完成。比如,机器人在小区进行安全防卫工作的时候,需要判定井盖是否存在或移位,需要判定消防器材是否缺失或移位,需要判定消防通道是否堵塞,以及需要判定小区内是否有异常行人出没等;这些静态的已经存在的事物,或者动态开始没有存在的事物等,都需要视觉传感器来解决。一般情况下,基于传统的目标检测包含以下几个步骤:目标分割,目标检测,目标识别及目标跟踪。目标分割是根据像素对前景和背景进行分类,将背景剔除,留出前景。目标检测就是定位目标,确定目标位置及大小。目标识别就是将目标进行定性分析,确定目标属于哪一类。目标跟踪是指追踪目标运动轨迹。在上述的目标检测的整个过程中,由于需要考虑物体的旋转、放大和缩小时的物体检测问题,所以目前的传统的目标检测方法,其在检测过程上耗时较长,从而严重影响了智能机器人的反应速度。
技术实现思路
本专利技术的目的在于提供一种能够快速对目标进行检测,检测耗时较短的基于机器视觉和深度学习的目标检测方法。本专利技术提供的这种基于机器视觉和深度学习的目标检测方法,包括如下步骤:S1.获取待检测目标的图像;S2.对步骤S1获取的图像的各个边界框进行回归并预测相应类别的概率;S3.对步骤S2得到的结果进行检测和优化;S4.根据步骤S3得到的优化后的结果,对目标间的中心空间位置进行计算,从而完成目标的检测。步骤S1所述的获取待检测目标的图像,具体为采用单目摄像头获取目标的实时图像,并将获取的实时图像调整为正方形大小。步骤S2所述的对图像的各个边界框进行回归并预测相应类别的概率,具体为采用卷积神经网络进行回归并预测相应类别的概率。所述的采用卷积神经网络进行回归并预测相应类别的概率,具体包括步骤:A.将步骤S1得到的图片分为S×S个网格,每个网格至少检测B个边界框;B.对步骤A得到的每个网格,采用如下公式进行置信度评分,并进行归一化:式中Z为置信度评分;Pr(object)为0-1函数,且若该网格包括物体,则Pr(object)取值为1,否则Pr(object)取值为0;为包含此物体的网格中,此物体位置的准确性,为两个区域重叠的部分与两个区域的集合部分之比;C.采用如下算式构造损失函数:式中λloss为损失函数,λnobj为修正指标系数,s为网格数,B为边界框个数,为物体落入格子i的第j个边界框内,xi为边界框横坐标训练标记值,x′i为边界框横坐标的预测值,yi为边界框纵坐标训练标记值,y′i为边界框纵坐标的预测值,wi为边界框宽度训练标记值,w′i为边界框宽度训练预测值,hi为边界框高度训练标记值,h′i为边界框高度训练预测值,Ci为参数IOU的训练标记值,C′i为参数IOU的预测值,pi(c)为分类的训练标记值,p′i(c)为分类的预测值。步骤S3所述的对结果进行检测和优化,具体为采用如下步骤进行检测和优化:a.采用如下算式计算每一个边界框的面积Smj:Smj=(x2-x1+1)(y2-y1+1)式中(x1,y1)为边界框最左上点的坐标,(x2,y2)为边界框最右下点的坐标;b.对所有边界框的置信度进行排序,并获取置信度的最大值,并将置信度最大的边界框加入队列;c.计算除最大置信度对应的边界框外剩余所有边界框的置信度与置信度最大值之间的值IOU,所述IOU为两个区域重叠的部分与两个区域的集合部分之间的比值;d.根据步骤c计算得到的各个边界框的IOU值,剔除IOU值大于设定的IOU阈值的边界框;e.重复步骤a~d直至边界框为空,从而得到最终的边界框队列。步骤S4所述的对目标间的中心空间位置进行计算,具体为采用如下步骤进行计算:(1)获取检测物体理论所在位置的矩形框参数;(2)获取检测物体实际的物理尺寸;(3)采用如下公式计算图像中物体的矩形框的中心的世界坐标:式中w为图像中矩形框的宽,w'为实际物体的矩形框的宽,fx为相机的内部参数,为x轴上的归一化焦距,fy为相机的内部参数,为y轴上的归一化焦距,cx为像素坐标系与成像平面相差的相对于原点的横坐标平移,cy为像素坐标系与成像平面相差的相对于原点的纵坐标平移,f为相机焦距,(u,v)为图像坐标,(X,Y,H)为物体的矩形框的中心的世界坐标;(4)若步骤(3)得到的物体的矩形框的中心的世界坐标与物体理论所在位置的矩形框的中心的世界坐标重合,则认定该物体在所在位置且物体完整。本专利技术提供的这种基于机器视觉和深度学习的目标检测方法,采用对图片进行直接识别的方式对图片的特征进行提取,因此本专利技术方法能够快速的对目标物体进行检测和定位,而且本专利技术方法简单可靠。附图说明图1为本专利技术方法的方法流程图。图2为本专利技术方法的根据物体实际尺寸计算H的相似关系示意图。图3为本专利技术方法的针孔相机模型计算世界坐标系到图像坐标系的转换关系示意图。具体实施方式如图1所示为本专利技术方法的方法流程图:本专利技术提供的这种基于机器视觉和深度学习的目标检测方法,包括如下步骤:S1.获取待检测目标的图像;具体为采用单目摄像头获取目标的实时图像,并将获取的实时图像调整为正方形大小;S2.对步骤S1获取的图像的各个边界框,采用卷积神经网络进行回归并预测相应类别的概率;具体包括步骤:A.将步骤S1得到的图片分为S×S个网格,每个网格至少检测B个边界框;B.对步骤A得到的每个网格,采用如下公式进行置信度评分,并进行归一化:式中Z为置信度评分;Pr(object)为0-1函数,且若该网格包括物体,则Pr(object)取值为1,否则Pr(object)取值为0;为包含此物体的网格中,此物体位置的准确性,为两个区域重叠的部分与两个区域的集合部分之比;C.采用如下算式构造损失函数:式中λloss为损失函数,λnobj为修正指标系数,s为网格数,B为边界框个数,为物体落入格子i的第j个边界框内,xi为边界框横坐标训练标记值,x′i为边界框横坐标的预测值,yi为边界框纵坐标训练标记值,y′i为边界框纵坐标的预测值,wi为边界框宽度训练标记值,w′i为边界框宽度训练预测值,hi为边界框高度训练标记值,h′i为边界框高度训练预测值,Ci为参数IOU的训练标记值,C′i为参数IOU的预测值,pi(c)为分类的训练标记值,p′i'(c)为分类的预测值;S3.对步骤S2得到的结果进行检测和优化;具体为采用如下步骤进行检测和优化:a.采用如下算式计算每一个边界框的面积Smj:Smj=(x2-x1+1)(y2-y1+1)式中(x1,y1)为边界框最左上点的坐标,(x2,y2)为边界框最右下点的坐标;b.对所有边界框的置信度进行排序,并获取置信度的最大值,并将置信度最大的边界框加入队列;c.计算除最大置信度对应的边界框外剩余所有边界框的置信度与置信度最大值之间的值IOU,所述IOU为两个区域重叠的部分与两个区域的集合部分之间的比值;d.根据步骤c计算得到的各个边界框的IOU值,剔除I本文档来自技高网...

【技术保护点】
1.一种基于机器视觉和深度学习的目标检测方法,包括如下步骤:S1.获取待检测目标的图像;S2.对步骤S1获取的图像的各个边界框进行回归并预测相应类别的概率;S3.对步骤S2得到的结果进行检测和优化;S4.根据步骤S3得到的优化后的结果,对目标间的中心空间位置进行计算,从而完成目标的检测。

【技术特征摘要】
1.一种基于机器视觉和深度学习的目标检测方法,包括如下步骤:S1.获取待检测目标的图像;S2.对步骤S1获取的图像的各个边界框进行回归并预测相应类别的概率;S3.对步骤S2得到的结果进行检测和优化;S4.根据步骤S3得到的优化后的结果,对目标间的中心空间位置进行计算,从而完成目标的检测。2.根据权利要求1所述的基于机器视觉和深度学习的目标检测方法,其特征在于步骤S1所述的获取待检测目标的图像,具体为采用单目摄像头获取目标的实时图像,并将获取的实时图像调整为正方形大小。3.根据权利要求1或2所述的基于机器视觉和深度学习的目标检测方法,其特征在于步骤S2所述的对图像的各个边界框进行回归并预测相应类别的概率,具体为采用卷积神经网络进行回归并预测相应类别的概率。4.根据权利要求3所述的基于机器视觉和深度学习的目标检测方法,其特征在于所述的采用卷积神经网络进行回归并预测相应类别的概率,具体包括步骤:A.将步骤S1得到的图片分为S×S个网格,每个网格至少检测B个边界框;B.对步骤A得到的每个网格,采用如下公式进行置信度评分,并进行归一化:式中Z为置信度评分;Pr(object)为0-1函数且若该网格包括物体,则Pr(object)取值为1,否则Pr(object)取值为0;为包含此物体的网格中,此物体位置的准确性,为两个区域重叠的部分与两个区域的集合部分之比;C.采用如下算式构造损失函数:式中λloss为损失函数,λnobj为修正指标系数,s为网格数,B为边界框个数,为物体落入格子i的第j个边界框内,xi为边界框横坐标训练标记值,x′i为边界框横坐标的预测值,yi为边界框纵坐标训练标记值,y′i为边界框纵坐标的预测值,wi为边界框宽度训练标记值,w′i为边界框宽度训练预测值,hi为边界框高度训练标记值,h′i为边界框高度训练预测值,Ci为参...

【专利技术属性】
技术研发人员:李金波刘琴明振
申请(专利权)人:湖南万为智能机器人技术有限公司
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1