目标对象检测方法、装置、存储介质以及电子装置制造方法及图纸

技术编号:33841049 阅读:10 留言:0更新日期:2022-06-18 10:23
本发明专利技术实施例提供了一种目标对象检测方法、装置、存储介质以及电子装置,该方法包括:获取一组连续帧图片,从一组连续帧图片中抽取第x帧待检测图片,并根据预定的时序信息依赖长度n从一组连续帧图片中抽取第x帧待检测图片的前n帧图片,n为大于1,且小于x的整数,将第x帧待检测图片以及前n帧图片输入目标神经网络模型,得到目标输出结果,因此,可以解决相关技术中存在的目标检测的过程较为复杂,在实际应用场景中利用效率较低的技术问题,达到提高目标对象的检测效率、降低检测成本的技术效果。果。果。

【技术实现步骤摘要】
目标对象检测方法、装置、存储介质以及电子装置


[0001]本专利技术实施例涉及通信领域,具体而言,涉及一种目标对象检测方法、装置、存储介质以及电子装置。

技术介绍

[0002]在当今城市化的快速扩张和经济的腾飞中,城市道路、高速、隧道和车辆急剧增多,使得对交通道路上摄像头产生的视频流图像处理工作量增大,以致超出人工负荷。为解决这一问题,各种针对视频流的目标检测算法应运而生,并取得了较多实际场景的应用。目前主流的视频目标检测算法可主要分为两类,即光流与深度学习相融合的视频目标检测算法和目标跟踪与静态图像检测相融合的视频目标检测算法。
[0003]其中,例如,基于光流与深度学习相融合的视频目标检测算法,在应用过程中缺少对视频流中上下文信息的充分利用,无法有效避免相邻帧中因目标姿态、光照等发生的变化而引起的目标漏检与误检等情况,同时因光流计算引入的耗时将限制算法的普及应用。
[0004]而例如,基于目标跟踪与静态图像检测相融合的视频目标检测算法,在应用过程中包含了较为复杂的算法结构,也限制了其在真实场景中的进一步应用。
[0005]针对相关技术中存在的目标检测的过程较为复杂,在实际应用场景中利用效率较低的技术问题,目前尚未提出有效的解决方案。

技术实现思路

[0006]本专利技术实施例提供了一种目标对象检测方法、装置、存储介质以及电子装置,以至少解决相关技术中存在的目标检测的过程较为复杂,在实际应用场景中利用效率较低的技术问题。
[0007]根据本专利技术的一个实施例,提供了一种目标对象检测方法,包括:获取一组连续帧图片;从所述一组连续帧图片中抽取第x帧待检测图片,并根据预定的时序信息依赖长度n从所述一组连续帧图片中抽取所述第x帧待检测图片的前n帧图片,所述n为大于1,且小于x的整数;将所述第x帧待检测图片以及所述前n帧图片输入目标神经网络模型,得到目标输出结果,其中,所述目标输出结果标注了所述目标边框,所述目标神经网络模型用于从所述第x帧待检测图片中基于所述前n帧图片包含的语义信息确定出所述目标边框,所述目标边框与所述第x帧图片中包含的目标对象相对应。
[0008]根据本专利技术的另一个实施例,提供了一种目标对象检测装置,包括:获取模块,用于获取一组连续帧图片;抽取模块,用于从所述一组连续帧图片中抽取第x帧待检测图片,并根据预定的时序信息依赖长度n从所述一组连续帧图片中抽取所述第x帧待检测图片的前n帧图片,所述n为大于1,且小于x的整数;处理模块,用于将所述第x帧待检测图片以及所述前n帧图片输入目标神经网络模型,得到目标输出结果,其中,所述目标输出结果标注了所述目标边框,所述目标神经网络模型用于从所述第x帧待检测图片中基于所述前n帧图片包含的语义信息确定出所述目标边框,所述目标边框与所述第x帧图片中包含的目标对象
相对应。
[0009]根据本专利技术的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述任一项方法实施例中的步骤。
[0010]根据本专利技术的又一个实施例,还提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项方法实施例中的步骤。
[0011]通过本专利技术,采用获取一组连续帧图片,从一组连续帧图片中抽取第x帧待检测图片,并根据预定的时序信息依赖长度n从一组连续帧图片中抽取第x帧待检测图片的前n帧图片,n为大于1,且小于x的整数,将第x帧待检测图片以及前n帧图片输入目标神经网络模型,得到目标输出结果,以确定出与第x帧图片中包含的目标对象相对应的目标边框,实现对目标对象的检测,因此,可以解决相关技术中存在的目标检测的过程较为复杂,在实际应用场景中利用效率较低的技术问题,达到提高目标对象的检测效率、降低检测成本的技术效果。
附图说明
[0012]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0013]图1是根据本专利技术实施例的一种可选的目标对象检测方法的移动终端的硬件结构框图;
[0014]图2是根据本专利技术实施例的一种可选的目标对象检测方法的流程示意图;
[0015]图3是根据本专利技术实施例的一种可选的目标对象检测方法的示意图;
[0016]图4是根据本专利技术实施例的另一种可选的目标对象检测方法的示意图;
[0017]图5是根据本专利技术实施例的另一种可选的目标对象检测方法的流程示意图;
[0018]图6是根据本专利技术实施例的一种可选的目标对象检测装置的结构框图。
具体实施方式
[0019]下文中将参考附图并结合实施例来详细说明本专利技术的实施例。
[0020]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
[0021]本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本专利技术实施例的一种目标对象检测方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
[0022]存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发
明实施例中的目标对象检测方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0023]传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
[0024]在本实施例中提供了一种运行于移动本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标对象检测方法,其特征在于,包括:获取一组连续帧图片;从所述一组连续帧图片中抽取第x帧待检测图片,并根据预定的时序信息依赖长度n从所述一组连续帧图片中抽取所述第x帧待检测图片的前n帧图片,所述n为大于1,且小于x的整数;将所述第x帧待检测图片以及所述前n帧图片输入目标神经网络模型,得到目标输出结果,其中,所述目标输出结果标注了所述目标边框,所述目标神经网络模型用于从所述第x帧待检测图片中基于所述前n帧图片包含的语义信息确定出所述目标边框,所述目标边框与所述第x帧图片中包含的目标对象相对应。2.根据权利要求1所述的方法,其特征在于,将所述第x帧待检测图片以及所述前n帧图片输入目标神经网络模型,得到目标输出结果,包括:将所述第x帧待检测图片输入二维卷积神经网络模型,得到第一输出结果,其中,所述目标神经网络模型包括所述二维卷积神经网络模型;将所述前n帧图片输入三维卷积神经网络模型,得到第二输出结果,其中,所述目标神经网络模型包括所述三维卷积神经网络模型;将所述第一输出结果和所述第二输出结果输入目标函数,得到所述目标输出结果。3.根据权利要求2所述的方法,其特征在于,将所述第x帧待检测图片输入二维卷积神经网络模型,得到第一输出结果,包括:在所述二维卷积神经网络模型包括M个卷积池化模块以及一个单独的卷积模块的情况下,将所述第x帧待检测图片输入所述M个卷积池化模块中的第一个卷积池化模块,以得到所述M个卷积池化模块中的第M个卷积池化模块的输出结果,其中,在所述M个卷积池化模块中,前一个卷积池化模块的输出为下一个卷积池化模块的输入;将所述第M个卷积池化模块的输出结果输入所述单独的卷积模块,得到第三输出结果;将所述第三输出结果以及所述M个卷积池化模块中的第M-2个卷积池化模块的输出结果输入特征金字塔模块,得到第四输出结果;将所述第三输出结果和所述第四输出结果确定为所述第一输出结果。4.根据权利要求2所述的方法,其特征在于,将所述前n帧图片输入三维卷积神经网络模型,得到第二输出结果,包括:在所述三维卷积神经网络模型包括N个卷积池化模块以及一个单独的卷积模块的情况下,将所述前n帧图片分别输入所述N个卷积池化模块中的第一个卷积池化模块,以得到所述N个卷积池化模块中的第N个卷积池化模块的输出结果,其中,在所述N个卷积池化模块中,前一个卷积池化模块的输出为下一个卷积池化模块的输入;将所述第N个卷积池化模块的输出结果输入所述单独的卷积模块,得到第五输出结果;对所述第五输出结果进行上采样和卷积运算,得到第六输出结果;将所述第五输出结果和所述第六输出结果确定为所述第二输出结果。5.根据权利要求2所...

【专利技术属性】
技术研发人员:李松余言勋王耀农
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1