目标检测方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:24997083 阅读:21 留言:0更新日期:2020-07-24 17:59
本申请实施例公开了目标检测方法、装置、电子设备和计算机可读介质。该方法的实施例包括:将待检测图像输入至预先训练的特征提取网络,得到特征图;将特征图输入至预先训练的类别检测网络和位置检测网络,得到第一类别检测结果和第一位置检测结果;将类别检测网络的其中一层的输出和第一位置检测结果输入至预先训练的第一边界特征增强网络,得到第二类别检测结果;将位置检测网络的其中一层的输出和第一位置检测结果输入至预先训练的第二边界特征增强网络,得到第二位置检测结果;基于各类别检测结果,确定待检测图像中的对象的最终类别检测结果,并基于各位置检测结果,确定对象的最终位置检测结果。该实施方式提高了目标检测结果的精确性。

【技术实现步骤摘要】
目标检测方法、装置、电子设备和计算机可读介质
本申请实施例涉及计算机
,具体涉及目标检测方法、装置、电子设备和计算机可读介质。
技术介绍
目标检测(ObjectDetection)是一种找出给定图像中的物体,并确定物体的类别、大小和位置的技术,是计算机视觉相关业务的基础技术之一。随着人工智能领域的发展,目标检测已应用在了越来越多的场景中。现有技术中,在使用SSD(SingleShotMultiBoxDetector,单阶段多框检测器)、YOLOv3(Youonlylookoncev3,统一的实时对象检测第三版)、FCOS(FullyConvolutionalOne-StageObjectDetection,全卷积单阶段目标检测)等常用的目标检测模型处理目标检测任务的过程中,通常将图像中的待测对象看作单点,并使用单点的区域特征进行检测框的密集预测,此过程中通常丢失了边界特征,导致目标预测结果的精确性有待提高。
技术实现思路
本申请实施例提出了目标检测方法、装置、电子设备和计算机可读介质,以解决现有技术中目标预测结果的精确性较低的技术问题。第一方面,本申请实施例提供了一种目标检测方法,该方法包括:将待检测图像输入至预先训练的特征提取网络,得到特征图;将特征图分别输入至预先训练的类别检测网络和位置检测网络,得到第一类别检测结果和第一位置检测结果;将类别检测网络的其中一层的输出和第一位置检测结果输入至预先训练的第一边界特征增强网络,得到第二类别检测结果;将位置检测网络的其中一层的输出和第一位置检测结果输入至预先训练的第二边界特征增强网络,得到第二位置检测结果;基于各类别检测结果,确定待检测图像中的对象的最终类别检测结果,并基于各位置检测结果,确定对象的最终位置检测结果。第二方面,本申请实施例提供了一种目标检测装置,该装置包括:第一输入单元,被配置成将待检测图像输入至预先训练的特征提取网络,得到特征图;第二输入单元,被配置成将特征图分别输入至预先训练的类别检测网络和位置检测网络,得到第一类别检测结果和第一位置检测结果;第三输入单元,被配置成将类别检测网络的其中一层的输出和第一位置检测结果输入至预先训练的第一边界特征增强网络,得到第二类别检测结果;第四输入单元,被配置成将位置检测网络的其中一层的输出和第一位置检测结果输入至预先训练的第二边界特征增强网络,得到第二位置检测结果;确定单元,被配置成基于各类别检测结果,确定待检测图像中的对象的最终类别检测结果,并基于各位置检测结果,确定对象的最终位置检测结果。第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中所描述的方法。第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中所描述的方法。本申请实施例提供的目标检测方法、装置、电子设备和计算机可读介质,通过将待检测图像输入至预先训练的特征提取网络,得到特征图;而后将特征图输入至预先训练的类别检测网络和位置检测网络,得到第一类别检测结果和第一位置检测结果;之后将类别检测网络的其中一层的输出和第一位置检测结果输入至预先训练的第一边界特征增强网络,得到第二类别检测结果;然后将位置检测网络的其中一层的输出和第一位置检测结果输入至预先训练的第二边界特征增强网络,得到第二位置检测结果;最后基于各类别检测结果,确定待检测图像中的对象的最终类别检测结果,并基于各位置检测结果,确定对象的最终位置检测结果。由此,在目标检测的过程中,除了提取常规特征外,还可以提取检测框的边界特征并对边界特征进行增强,提高了特征提取的能力,从而提高了目标预测结果的精确性。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是根据本申请的目标检测方法的一个实施例的流程图;图2是根据本申请的各网络的连接关系示意图;图3是根据本申请的边界特征增强网络的边界特征提取层所执行的操作的流程图;图4是根据本申请的边界特征增强网络的边界特征提取层的特征处理过程示意图;图5是根据本申请的目标检测装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。具体实施方式下面基于附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并基于实施例来详细说明本申请。请参考图1,其示出了根据本申请的目标检测方法的一个实施例的流程100。信息获取方法的执行主体可以是各种电子设备或运行于电子设备中的处理器。例如,上述电子设备可以包括但不限于服务器、智能手机、平板电脑、膝上型便携计算机、台式计算机和可穿戴设备等等。该目标检测方法,包括以下步骤:步骤101,将待检测图像输入至预先训练的特征提取网络,得到特征图。在本实施例中,目标检测方法的执行主体中可以存储有预先训练的目标检测模型。目标检测模型中可以包括特征提取网络。目标检测模型可以采用机器学习方法(如有监督学习方式)预先训练得到,从而得到训练后的特征提取网络。特征提取网路可以用于从待检测的图像中提取图像特征。实践中,所提取的图像特征可以以特征图(featuremap)的形式表示。此处的特征提取网络可以采用各种能够提取图像特征的神经网络结构。例如,可以采用ResNet(ResidualNeuralNetwork,残差神经网络)和FPN(FeaturePyramidNetwork,特征金字塔网络)结构组成。其中,ResNet是一种常规的卷积神经网络(ConvolutionalNeuralNetworks,CNN)。FPN是一种利用常规的卷积神经网络来提取图片中各维度特征的网络。FPN通过自底向上(bottom-up)、自顶向下(top-down)以及横向连接(lateralconnection),将从常规的卷积神经网络所提取的浅层的特征和深层的特征进行高效整合,从而能够将浅层和深层的特征相基于,实现得到表达能力更强的特征图。需要说明的是,除了采用ResNet和FPN相基于的网络之外,还可以采用其他图像特征提取网络作为特征提取网络,本实施例对此不作限定。在本实施例中,预先训练的目标检测模型中除包含特征提取网络外,还可以包含类别检测网络、位置检测网络、第一边界特征增强网络和第二边界特征增强网络。作为示例,图2示出了各网络的连接关系示意图。如图2所示,各网络用虚线框表示,特征提取网络分别与特征提取网络相连接,第一边界特征增强网络与类别检测网络的其中一层相连接,第二边界特征本文档来自技高网...

【技术保护点】
1.一种目标检测方法,其特征在于,所述方法包括:/n将待检测图像输入至预先训练的特征提取网络,得到特征图;/n将所述特征图分别输入至预先训练的类别检测网络和位置检测网络,得到第一类别检测结果和第一位置检测结果;/n将所述类别检测网络的其中一层的输出和所述第一位置检测结果输入至预先训练的第一边界特征增强网络,得到第二类别检测结果;/n将所述位置检测网络的其中一层的输出和所述第一位置检测结果输入至预先训练的第二边界特征增强网络,得到第二位置检测结果;/n基于各类别检测结果,确定所述待检测图像中的对象的最终类别检测结果,并基于各位置检测结果,确定所述对象的最终位置检测结果。/n

【技术特征摘要】
1.一种目标检测方法,其特征在于,所述方法包括:
将待检测图像输入至预先训练的特征提取网络,得到特征图;
将所述特征图分别输入至预先训练的类别检测网络和位置检测网络,得到第一类别检测结果和第一位置检测结果;
将所述类别检测网络的其中一层的输出和所述第一位置检测结果输入至预先训练的第一边界特征增强网络,得到第二类别检测结果;
将所述位置检测网络的其中一层的输出和所述第一位置检测结果输入至预先训练的第二边界特征增强网络,得到第二位置检测结果;
基于各类别检测结果,确定所述待检测图像中的对象的最终类别检测结果,并基于各位置检测结果,确定所述对象的最终位置检测结果。


2.根据权利要求1所述的目标检测方法,其特征在于,所述第一边界特征增强网络和所述第二边界特征增强网络分别依次包括第一卷积层、边界特征提取层和第二卷积层;
其中,所述第一卷积层用于增加输入至所述第一卷积层的特征图的通道数,所述边界特征提取层用于增强所述第一位置检测结果所指示的检测框的边界特征,所述第二卷积层用于降低输入至所述第二卷积层的特征图的通道数。


3.根据权利要求2所述的目标检测方法,其特征在于,所述第一位置检测结果用于指示各特征点对应的检测框的边界位置,特征点与检测框一一对应;以及,
所述边界特征提取层通过如下步骤增强检测框的边界特征:
按照通道数量,将所述第一卷积层输出的特征图均分为五组,其中四组特征图分别用于提取不同边界的边界特征;
基于各特征点对应的检测框的边界位置,从所述其中四组特征图中,提取各特征点对应的检测框的不同边界的最大特征值;
将从同一特征图中提取的最大特征值汇总为一个通道的增强特征图,将其余一组特征图中的每一个特征图作为一个通道的增强特征图,得到多通道的特征增强图。


4.根据权利要求3所述的目标检测方法,其特征在于,所述基于各特征点对应的检测框的边界位置,从所述其中四组特征图中,提取各特征点对应的检测框的不同边界的最大特征值,包括:
依次将每一个特征点作为目标特征点,将所述目标特征点对应的检测框作为目标检测框,执行如下步骤:
分别对所述目标检测框的各边界设置多个采样点;
基于所述目标检测框的左边界位置,从用于提取左边界的特征的各特征图中,获取左边界的各采样点的特征值,并从所获取的左边界的各采样点的特征值中,选取最大特征值;
基于所述目标检测框的上边界位置,从用于提取上边界的特征的各特征图中,获取上边界的各采样点的特征值,并从所获取的上边界的各采样点的特征值中,选取最大特征值;
基于所述目标检测框的右边界位置,从用于提取右边界的特征的各特征图中,获取右边界的各采样点的特征值,并从所获取的右边界的各采样点的特征值中,选取最大特征值;
基于所述目标检测框的下边界位置,从用于提取下边界的特征的各特征图中,获取下边界的各采样点的特征值,并从所获取的下边界的各采样点的特征值中,选取最大特征值。


5.根据权利要求1所述的目标检测方法,其特征在于,所述第一类别检测结果包括多个通道的第一类别得分图,不同通道的第一类别得分图对应不...

【专利技术属性】
技术研发人员:马宇宸邱晗黎泽明
申请(专利权)人:北京迈格威科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1