一种目标检测方法与装置制造方法及图纸

技术编号:22944803 阅读:33 留言:0更新日期:2019-12-27 17:12
提出了一种目标检测方法与装置。所述的目标检测方法(100)包括:输入图像数据(S110);使输入的图像数据通过卷积神经网络,得到关于检测目标的目标检测框的输出特征数据(S120);对输出特征数据进行近似处理(S130);输出近似处理后的输出特征数据(S140)。针对于现有技术中出现的目标检测框的抖动问题,本技术仅仅基于图像检测方法本身,对网络输出特征进行约束设计,在不需要结合追踪方法的基础上提高所显示的目标检测框的稳定性。本技术简单易实现,并且不需要额外的算力开销。

【技术实现步骤摘要】
一种目标检测方法与装置
本专利技术涉及图像识别,更具体涉及一种目标检测方法与装置。
技术介绍
近年来,随着深度学习的发展,深度学习在计算机视觉中的分类、目标检测、分割领域都取得了巨大的成功。目标检测作为计算机视觉的基础研究方向,检测性能的好坏决定了其他任务的研究。现有大多数检测方法都是通过人工标注图像数据集,进行神经网络训练最后预测结果。通过这种方法设计的算法,在视频的测试中可能发生的问题是,相邻的两帧出现预测误差,导致显示检测的目标框出现抖动。针对这样的问题,现有的方法是通过添加追踪算法,用检测和追踪相结合的方式来进行解决。这样尽管消除或减小了抖动误差,但增加的算法带来了额外的算力开销。
技术实现思路
本专利技术的实施例提供一种目标检测方法与装置,针对
技术介绍
中所提到的目标检测框的抖动问题,仅仅基于图像检测方法本身,对网络输出特征进行约束设计,在不需要结合追踪方法的基础上提高所显示的目标检测框的稳定性。本方法简单易实现,并且不需要额外的算力开销。为了实现本专利技术的目的,根据本专利技术的第一方面,提供一种目标检测方法。该目标检测方法可以包括:输入图像数据;使输入的图像数据通过卷积神经网络,得到关于检测目标的目标检测框的输出特征数据;对输出特征数据进行近似处理;输出近似处理后的输出特征数据。然而,在以上的方法中,近似处理可能存在误差。为了进一步消除这一误差,优选地,所述的对输出特征数据进行近似处理的步骤可以进一步包括:基于相邻的输出特征数据,对输出特征数据进行归一化处理;对归一化处理后的输出特征数据进行近似处理。优选地,所述的近似处理的步骤包括:将数值近似为只取到保留小数点后若干位。此外,根据本专利技术的第一方面的目标检测方法可以进一步包括:根据输出后的输出特征数据,在图像上显示目标检测框。为了实现本专利技术的目的,根据本专利技术的第二方面,提供一种目标检测装置。该目标检测装置可以包括:输入模块,用于输入图像数据;网络模块,用于使输入的图像数据通过卷积神经网络,得到关于检测目标的目标检测框的输出特征数据;近似处理模块,用于对输出特征数据进行近似处理;输出模块,用于输出近似处理后的输出特征数据。同样地,为了进一步消除近似处理中的误差,优选地,所述的近似处理模块可以进一步包括:归一化子模块,用于基于相邻的输出特征数据,对输出特征数据进行归一化处理;归一化近似处理子模块,用于对归一化处理后的输出特征数据进行近似处理。优选地,所述的近似处理模块或所述的归一化近似处理子模块可以被进一步配置用于将数值近似为只取到保留小数点后若干位。此外,根据本专利技术的第二方面的目标检测装置可以进一步包括目标检测框显示模块,用于根据输出后的输出特征数据,在图像上显示目标检测框。为了实现本专利技术的目的,根据本专利技术的第三方面,提供一种计算机可读介质,用于记录可由处理器执行的指令,所述指令在被处理器执行时,使得处理器执行目标检测方法,包括如下操作:输入图像数据;使输入的图像数据通过卷积神经网络,得到关于检测目标的目标检测框的输出特征数据;对输出特征数据进行近似处理;输出近似处理后的输出特征数据。类似地,为了进一步消除近似处理中的误差,优选地,所述的对输出特征数据进行近似处理的操作可以进一步包括:基于相邻的输出特征数据,对输出特征数据进行归一化处理;对归一化处理后的输出特征数据进行近似处理。基于本专利技术的目标检测技术,针对于现有技术中出现的目标检测框的抖动问题,不用引入追踪算法及其额外的算力,只通过近似处理来消除引起抖动的预测误差,从而能够简单实现且效果良好。此外,通过归一化操作减小近似处理的误差,使得本专利技术的目标检测技术能够进一步达到良好的防抖动效果。附图说明下面参考附图结合实施例说明本专利技术。图1示出了根据本专利技术实施例的目标检测方法的流程图。图2示出了图1的目标检测方法中的近似处理的详细步骤。图3示出了根据本专利技术实施例的目标检测装置的示意框图。图4示出了根据本专利技术具体实施例的对网络输出特征进行近似处理的过程。图5示出了根据本专利技术具体实施例的对网络输出特征进行近似处理的更详细过程。具体实施方式附图仅用于示例说明,不能理解为对本专利技术的限制。下面结合附图和实施例对本专利技术的技术方案做进一步的说明。图1示出了根据本专利技术实施例的目标检测方法的流程图。如图1中所示,根据本专利技术的目标检测方法100开始于步骤S110,在此步骤,输入图像数据。本领域技术人员应该理解,一般情况下,输入的图像数据可能是动态视频中的一帧的数据。目标检测方法100用于在这样的一帧图像中寻找合适的目标对象。该目标对象可以是事先确定的,或者根据某种规则而在图像中确定的。在步骤S120,使输入的图像数据通过卷积神经网络,得到关于检测目标的位置的特征数据。利用特征数据对目标在图像中位置进行预测,并用矩形框标识出来。如前所述,实践中存在的一个问题就是:动态视频中的相邻的两帧,目标几乎没有变化,但是由于预测误差,导致预测的目标检测框出现抖动。例如,假设一段视频中我们设定每秒检测20帧图像,显示出每帧图像的目标检测框。那么,这个目标检测框在一秒钟内会出现20次,由于预测误差的存在,显示出的目标检测框会在每帧之间产生很小但又能被察觉到的位移,使得观看者在视觉上产生抖动的效果,观感十分不适。为了解决这一问题,接下来,在步骤S130,对输出特征数据进行近似处理。图2示出了图1的目标检测方法中的近似处理的详细步骤。具体地说,步骤S130中所述的对输出特征数据进行近似处理可以进一步包括以下两个子步骤:在步骤S130a,基于相邻的输出特征数据,对输出特征数据进行归一化处理;然后,在步骤S130b,对归一化处理后的输出特征数据进行近似处理。归一化的操作减小了近似处理的误差,使得本专利技术的目标检测方法能够进一步达到良好的防抖动效果。更具体地说,这里提到的近似处理(S130或S130b)是指将数值近似为只取到保留小数点后若干位。例如,对于输出特征数据,其每一个数值的精度只保留到小数点后第3位或第5位或第n位。最后,在步骤S140,输出近似处理后的输出特征数据。在步骤S140之后,本专利技术的目标检测方法100还可以进一步包括:根据输出后的输出特征数据,在图像上显示目标检测框(未在图1中示出)。然而,就本专利技术的核心目的与核心方案而言,到步骤S140,本方法就可以结束了。图3示出了根据本专利技术实施例的目标检测装置的示意框图。如图3中所示,根据本专利技术的目标检测装置300可以包括:输入模块301、网络模块302、近似处理模块303和输出模块304。输入模块301用于输入图像数据。本领域技术人员应该理解,输入模块301所执行的操作对应于图1中的步骤S110。网络模块302用于使输入的图像数据通过卷积神经网络,得到关于检测目标的目标检测框的输出特征数据。本领域技术人员应该理解,网络模块302所执行的操作对应于本文档来自技高网...

【技术保护点】
1.一种目标检测方法,包括:/n输入图像数据;/n使输入的图像数据通过卷积神经网络,得到关于检测目标的目标检测框的输出特征数据;/n对输出特征数据进行近似处理;/n输出近似处理后的输出特征数据。/n

【技术特征摘要】
1.一种目标检测方法,包括:
输入图像数据;
使输入的图像数据通过卷积神经网络,得到关于检测目标的目标检测框的输出特征数据;
对输出特征数据进行近似处理;
输出近似处理后的输出特征数据。


2.如权利要求1所述的目标检测方法,其中,所述的对输出特征数据进行近似处理的步骤进一步包括:
基于相邻的输出特征数据,对输出特征数据进行归一化处理;
对归一化处理后的输出特征数据进行近似处理。


3.如权利要求1或2所述的目标检测方法,其中,所述的近似处理的步骤包括:将数值近似为只取到保留小数点后若干位。


4.如权利要求1所述的目标检测方法,进一步包括:根据输出后的输出特征数据,在图像上显示目标检测框。


5.一种目标检测装置,包括:
输入模块,用于输入图像数据;
网络模块,用于使输入的图像数据通过卷积神经网络,得到关于检测目标的目标检测框的输出特征数据;
近似处理模块,用于对输出特征数据进行近似处理;
输出模块,用于输出近似处理后的输出特征数据。


6.如权利要求5所述的目标检测装置,其中,所...

【专利技术属性】
技术研发人员:彭劲璋
申请(专利权)人:北京深鉴智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1