一种基于卷积神经网络的目标边界实时检测方法技术

技术编号:25891320 阅读:37 留言:0更新日期:2020-10-09 23:33
本发明专利技术公开一种基于卷积神经网络的目标边界实时检测方法,首先输入图片,提取该图片的特征图,预测边界框坐标和置信评分预测值。然后通过特征图得到引用边界框坐标,根据预测边界框坐标和引用边界框坐标计算出相关边界框坐标和实际边界框坐标,计算相关边界框和实际边界框的重叠值,对具有最大重叠部分的实际边界框设置最大重叠标记。最后根据重叠值,最大重叠标记和置信评分预测值计算引用边界框的置信评分,保留前N个具有最高置信评分的引用边界框,过滤其他边界框,得到最终结果。本发明专利技术将卷积神经网络用来提取特征图和作为输出层去计算边界框坐标和置信评分,通过多任务的损失函数训练卷积层,有效提高卷积神经网络的运行效率和计算精度。

【技术实现步骤摘要】
一种基于卷积神经网络的目标边界实时检测方法
本专利技术涉及一种基于卷积神经网络的目标边界实时检测方法,属于计算机视觉、模式识别、机器学习等交叉

技术介绍
近年来,目标检测成为计算机视觉领域中的一个应用,对目标的检测除了要求很高的准确度外,对检测速度的要求也越来越高。目标检测在日常生活中的应用越来越广泛,具有重要的理论意义与实际应用价值。模式识别是通过计算机用数学技术方法来研究模式的自动处理和判读,而信息处理过程的一个重要形式是生命体对环境及客体的识别,特别重要的是对光学信息和声学信息的识别。计算机视觉主要研究的就是对光学信息的识别。近年来兴起的卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一,卷积神经网络仿造生物的视知觉机制构建,可以进行监督学习和非监督学习,其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化特征进行学习、有稳定的效果且对数据没有额外的特征工程要求。卷积神经网络的结构一般分为输入层,隐含层和输出层。输入层可以处理多维数据,由于使用梯度下降进行学习,输入特征需要进行标准化处理;隐含层包含卷积层、池化层和全连接层3类常见构筑;输出层的上游通常是全连接层,因此其结构和工作原理与传统前馈神经网络中的输出层相同,对于图像分类问题,输出层使用逻辑函数或归一化指数函数输出分类标签,而在物体识别问题中,输出层还可设计为输出物体的中心坐标、大小和分类等。对目标的实时检测依赖于系统对环境的精准感知,即准确实时地检测出对象,这一要求不仅需要系统有足够的精度,也需要足够的速度。最近很多研究人员专注于提高神经网络的准确度,提出了多种神经网络结构来提高精度,同时降低能耗,对准确度的提升有很大帮助。基于上述研究成果,本专利技术提出一种基于卷积神经网络的目标边界实时检测方法,旨在使模型在训练过程中能更高效地检测对象。
技术实现思路
技术问题:本专利技术的目的在于提供一种利用卷积神经网络更高效快速的完成目标实时检测的方法,该方法中的卷积神经网络同时用来提取特征图和作为输出层去计算结果,再通过多任务的损失函数训练卷积层,从而提高卷积神经网络的运行效率和计算精度。技术方案:本专利技术的一种基于卷积神经网络的目标边界实时检测方法包括以下步骤:步骤1)将一张图片输入YOLO(YouOnlyLookOnce)网络,输出只含像素值的特征图,预测边界框坐标和置信评分预测值;步骤2)以步骤1)中的特征图的左上角为原点,横向为x轴,纵向为y轴建立二维坐标系,将特征图分成W×H个均匀分布的长宽相等的网格,W和H分别是沿水平方向和垂直方向的网格数,在每个网格上计算K个引用边界框的坐标,K为预先设定的值,位置(i,j)网格上的引用边界框坐标为其中分别是第i行第j个网格的中心点的横坐标和纵坐标,分别是第k个引用边界框的宽和高,步骤1)中的预测边界框坐标表示方法是:位置(i,j)网格上的第k个预测边界框的坐标为步骤3)根据步骤2)中引用边界框坐标和预测边界框坐标计算出相关边界框坐标和实际边界框坐标,求得的在位置(i,j)网格上的第k个相关边界框的坐标为(δxijk,δyijk,δwijk,δhijk),在位置(i,j)网格上的第k个实际边界框的坐标为步骤4)将步骤3)中求得的位置(i,j)网格上的相关边界框的坐标与实际边界框的坐标进行比较,计算两边界框的重叠值选择与当前相关边界框具有最大重叠的实际边界框,设置最大重叠标志Iijk;步骤5)步骤1)中的置信评分预测值γijk表示位置(i,j)网格上的第k个引用边界框的置信评分预测值,根据Iijk,和γijk计算出每个引用边界框的置信评分,将引用边界框按置信评分由大到小排序,保留前N个边界框,过滤多余的边界框以获得最终的检测结果;其中所述步骤3)具体如下:步骤31)对引用边界框和预测边界框根据如下公式计算在位置(i,j)网格上的第k个相关边界框坐标(δxijk,δyijk,δwijk,δhijk):步骤32)对引用边界框和预测边界框根据如下公式计算在位置(i,j)网格上的第k个实际边界框坐标所述步骤4)具体如下:步骤41)对位置(i,j)网格上的相关边界框(δxijk,δyijk,δwijk,δhijk),实际边界框坐标根据如下公式计算重叠值步骤42)对位置(i,j)网格上的所有实际边界框,比较设置最大重叠标志Iijk,其含义为:若在位置(i,j)网格上的第k个实际边界框与相关边界框具有最大重叠,即在i,j相同的情况下,若所有重叠值中的第k个重叠值最大,则Iijk的值为1,否则值为0;所述步骤5)具体如下:步骤51)对最大重叠标志Iijk,重叠值和置信评分预测值γijk,根据如下函数计算前N个具有最高置信评分的引用边界框的置信评分和:其中步骤52)对非前N个具有最高置信评分的引用边界框,即无用边界框,我们使用如下函数过滤这些多余的无用边界框:其中有益效果:本专利技术采用以上技术方案与现有技术相比,具有以下技术效果:本专利技术提出一种基于卷积神经网络的目标边界实时检测方法,利用卷积神经网络提取特征图和计算边界框,通过多任务的损失函数对卷积层进行训练,以此来提高卷积神经网络的运行效率和计算精度。具体来说:(1)本专利技术提出的一种能同时提取特征图和计算边界框卷积神经网络,与普通神经网络相比,网络结构更加高效,识别更加快速;(2)本专利技术提出的边界框坐标的转换方法,丰富了原始数据的内容和复杂程度,有效增加了系统的可信度;(3)本专利技术提出的保留前N个最大置信评分的边界框来得到最终结果的方法,选择了所有处理结果中的最优解,增强系统的精确度,降低了处理数据的复杂度;(4)本专利技术提出的过滤无用边界框的方法,有效删除了无用数据,避免了无用数据对结果的干扰。附图说明图1是基于卷积神经网络的目标边界实时检测方法流程。具体实施方法下面结合附图对本专利技术的技术方案做进一步的详细说明:在具体实施中,图1是基于卷积神经网络的目标边界实时检测方法流程。首先通过YOLO网络从输入的图片中提取出只含像素值的特征图,置信评分预测值和预测边界框,预测边界框坐标为将特征图转化为W×H×K个引用边界框,坐标分别为接着根据预测边界框和引用边界框计算出相关边界框(δxijk,δyijk,δwijk,δhijk),根据预测边界框和引用边界框计算出实际边界框然后计算相关边界框和实际边界框坐标的重叠值选择与当前相关边界框具有最大重叠的实际边界框,设置最大重叠标志Iijk,即若在位置(i,j)网格上的第k个实际边界框与相关边界框具有最大重叠,则Iijk的值为1,否则值为0。最后根据位置(i,j)网格上的第k个本文档来自技高网
...

【技术保护点】
1.一种基于卷积神经网络的目标边界实时检测方法,其特征在于,包括以下步骤:/n步骤1)将图片输入YOLO网络,得到只含像素值的特征图,预测边界框坐标和置信评分预测值;/n步骤2)以步骤1)中的特征图的左上角为原点,横向为x轴,纵向为y轴建立二维坐标系,将特征图分成W×H个均匀分布的长宽相等的网格,W和H分别是沿水平方向和垂直方向的网格数,在每个网格上计算K个引用边界框的坐标,K为预先设定的值,位置(i,j)网格上的引用边界框坐标为

【技术特征摘要】
1.一种基于卷积神经网络的目标边界实时检测方法,其特征在于,包括以下步骤:
步骤1)将图片输入YOLO网络,得到只含像素值的特征图,预测边界框坐标和置信评分预测值;
步骤2)以步骤1)中的特征图的左上角为原点,横向为x轴,纵向为y轴建立二维坐标系,将特征图分成W×H个均匀分布的长宽相等的网格,W和H分别是沿水平方向和垂直方向的网格数,在每个网格上计算K个引用边界框的坐标,K为预先设定的值,位置(i,j)网格上的引用边界框坐标为其中分别是第i行第j个网格的中心点的横坐标和纵坐标,分别是第k个引用边界框的宽和高,步骤1)中的预测边界框坐标表示方法是:位置(i,j)网格上的第k个预测边界框的坐标为
步骤3)根据步骤2)中引用边界框坐标和预测边界框坐标计算出相关边界框坐标和实际边界框坐标,求得的在位置(i,j)网格上的第k个相关边界框的坐标为(δxijk,δyijk,δwijk,δhijk),在位置(i,j)网格上的第k个实际边界框的坐标为
步骤4)将步骤3)中求得的位置(i,j)网格上的相关边界框的坐标与实际边界框的坐标进行比较,计算两边界框的重叠值选择与当前相关边界框具有最大重叠的实际边界框,设置最大重叠标志Iijk;
步骤5)步骤1)中的置信评分预测值γijk表示位置(i,j)网格上的第k个引用边界框的置信评分预测值,根据Iijk,和γijk计算出每个引用边界框的置信评分,将引用边界框按置信评分由大到小排序,保留前N个边界框,过滤多余的边界框以获得最终的检测结果。


2.根据权利要求1所述的一种基于卷积神经网络的目标边界实时检测方法,其特征在于所述步骤3)具体如下:...

【专利技术属性】
技术研发人员:徐秋石岳文静陈志熊礼亮
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1