图像检测方法、装置、设备以及存储介质制造方法及图纸

技术编号:25551833 阅读:21 留言:0更新日期:2020-09-08 18:52
本申请实施例公开了图像检测方法、装置、设备以及存储介质,涉及人工智能、深度学习、图像处理技术领域。该方法的一具体实施方式包括:将待检测图像输入至预先训练的多任务检测模型,其中,多任务检测模型包括位置检测分支网络和属性预测分支网络;利用位置检测分支网络对待检测图像进行处理,得到待检测图像中的目标的位置;利用属性预测分支网络对待检测图像进行处理,得到待检测图像中的目标的属性;对应输出待检测图像中的至少部分目标的位置和属性。该实施方式利用包括位置检测分支网络和属性预测分支网络的多任务检测模型同时进行位置检测和属性预测,并且属性预测分支网络能够一次预测所有目标的属性,大大降低了多任务检测耗时。

【技术实现步骤摘要】
图像检测方法、装置、设备以及存储介质
本申请实施例涉及计算机
,具体涉及人工智能、深度学习、图像处理
,特别涉及图像检测方法、装置、设备以及存储介质。
技术介绍
目标检测是深度学习中的一种检测模型,目标检测模型可以定位出一张图像中的多个目标的边界框。对于普通的目标检测模型,当输入一张图像时,仅输出图像中的多个目标的位置。当需要进行多任务检测时,通常需要多个模型来完成。例如,在目标检测模型检测出图像中的多个目标的边界框之后,将多个目标的边界框以规定的格式从原图像中分别抠出,在对抠出的多个目标的边界框做少量变换之后,依次输入至属性预测模型,以得到多个目标的属性值。
技术实现思路
本申请实施例提出了图像检测方法、装置、设备以及存储介质。第一方面,本申请实施例提出了一种图像检测方法,包括:将待检测图像输入至预先训练的多任务检测模型,其中,多任务检测模型包括位置检测分支网络和属性预测分支网络;利用位置检测分支网络对待检测图像进行处理,得到待检测图像中的目标的位置;利用属性预测分支网络对待检测图像进行处理,得到待检测图像中的目标的属性;对应输出待检测图像中的至少部分目标的位置和属性。第二方面,本申请实施例提出了一种图像检测装置,包括:图像输入模块,被配置成将待检测图像输入至预先训练的多任务检测模型,其中,多任务检测模型包括位置检测分支网络和属性预测分支网络;位置检测模块,被配置成利用位置检测分支网络对待检测图像进行处理,得到待检测图像中的目标的位置;属性预测模块,被配置成利用属性预测分支网络对待检测图像进行处理,得到待检测图像中的目标的属性;对应输出模块,被配置成对应输出待检测图像中的至少部分目标的位置和属性。第三方面,本申请实施例提出了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面中任一实现方式描述的方法。第四方面,本申请实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面中任一实现方式描述的方法。本申请实施例提供的图像检测方法、装置、设备以及存储介质,首先将待检测图像输入至预先训练的多任务检测模型;然后利用位置检测分支网络对待检测图像进行处理,得到待检测图像中的目标的位置,同时利用属性预测分支网络对待检测图像进行处理,得到待检测图像中的目标的属性;最后对应输出待检测图像中的至少部分目标的位置和属性。利用包括位置检测分支网络和属性预测分支网络的多任务检测模型同时进行位置检测和属性预测,并且属性预测分支网络能够一次预测所有目标的属性,大大降低了多任务检测耗时。避免了先单独使用目标检测模型检测图像中的目标框,再单独使用属性预测模型预测目标框中的目标的属性,属性预测模型预测耗时随着目标数线性增长的问题。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显。附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是本申请可以应用于其中的示例性系统架构;图2是根据本申请的图像检测方法的一个实施例的流程图;图3是多任务检测模型在预测时的网络结构的示意图;图4是根据本申请的多任务检测模型训练方法的一个实施例的流程图;图5是多任务检测模型在训练时的网络结构的示意图;图6是根据本申请的图像检测装置的一个实施例的结构示意图;图7是用来实现本申请实施例的图像检测方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的图像检测方法或图像检测装置的实施例的示例性系统架构100。如图1所示,系统架构100中可以包括终端设备101、网络102和服务器103。网络102用以在终端设备101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101通过网络102与服务器103交互,以接收或发送消息等。终端设备101上可以安装有各种客户端应用,例如图像处理应用等等。终端设备101可以是硬件,也可以是软件。当终端设备101为硬件时,可以是具有摄像头的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101为软件时,可以安装在上述电子设备中。其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。服务器103可以是提供各种服务的服务器,例如图像处理应用的后台服务器。图像处理应用的后台服务器可以对从终端设备101获取到的待检测图像等数据进行分析等处理,并将处理结果(例如待检测图像中的至少部分目标的位置和属性)反馈给终端设备101。需要说明的是,服务器103可以是硬件,也可以是软件。当服务器103为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器103为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。需要说明的是,本申请实施例所提供的图像检测方法一般由服务器103执行,相应地,图像检测装置一般设置于服务器103中。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。在服务器103中存储有待检测图像的情况下,系统架构100可以不设置终端设备101和网络102。此外,在终端设备101具备检测能力的情况下,本申请实施例所提供的图像检测方法也可以由终端设备101执行,相应地,图像检测装置也可以设置于终端设备101中。此时,系统架构100可以不设置网络102和服务器103。继续参考图2,其示出了根据本申请的图像检测方法的一个实施例的流程200。该图像检测方法包括以下步骤:步骤201,将待检测图像输入至预先训练的多任务检测模型。在本实施例中,图像检测方法的执行主体(例如图1所示的服务器103)可以将待检测图像输入至预先训练的多任务检测模型。通常,终端设备(例如图1所示的终端设备101)可以将待检测图像发送至上述执行主体。在接收到待检测图像本文档来自技高网...

【技术保护点】
1.一种图像检测方法,包括:/n将待检测图像输入至预先训练的多任务检测模型,其中,所述多任务检测模型包括位置检测分支网络和属性预测分支网络;/n利用所述位置检测分支网络对所述待检测图像进行处理,得到所述待检测图像中的目标的位置;/n利用所述属性预测分支网络对所述待检测图像进行处理,得到所述待检测图像中的目标的属性;/n对应输出所述待检测图像中的至少部分目标的位置和属性。/n

【技术特征摘要】
1.一种图像检测方法,包括:
将待检测图像输入至预先训练的多任务检测模型,其中,所述多任务检测模型包括位置检测分支网络和属性预测分支网络;
利用所述位置检测分支网络对所述待检测图像进行处理,得到所述待检测图像中的目标的位置;
利用所述属性预测分支网络对所述待检测图像进行处理,得到所述待检测图像中的目标的属性;
对应输出所述待检测图像中的至少部分目标的位置和属性。


2.根据权利要求1所述的方法,其中,位置包括目标框的坐标、得分和索引;以及
所述对应输出所述待检测图像中的至少部分目标的位置和属性,包括:
基于目标框的得分选取所述待检测图像中的至少部分目标;
使用所选取的每个目标的目标框的索引在所述待检测图像中的目标的属性中查找,得到所选取的每个目标的属性;
对应输出所选取的每个目标的位置和属性。


3.根据权利要求1所述的方法,其中,所述多任务检测模型的训练步骤包括:
获取样本图像集合;
对于所述样本图像集合中的样本图像,若该样本图像中的目标同时标注位置和属性,将该样本图像作为输入,将该样本图像中的目标的标注位置和标注目标属性作为输出,训练所述多任务检测模型。


4.根据权利要求3所述的方法,其中,所述多任务检测模型的训练步骤还包括:
若该样本图像中的目标仅标注位置,将该样本图像作为输入,将该样本图像中的目标的标注位置作为输出,训练所述多任务检测模型中的位置检测分支网络。


5.根据权利要求4所述的方法,其中,所述位置检测分支网络包括位置检测网络主体、坐标分支和得分分支;以及
所述将该样本图像作为输入,将该样本图像中的目标的标注位置作为输出,训练所述多任务检测模型中的位置检测分支网络,包括:
将该样本图像输入至所述位置检测网络主体,得到该样本图像的位置特征;
将该样本图像的位置特征分别输入至所述坐标分支和所述得分分支,得到该样本图像中的目标框的预测坐标和预测得分;
基于该样本图像中的目标框的预测坐标和预测得分,以及目标的标注位置,计算位置损失函数;
基于所述位置损失函数调整所述位置检测分支网络的参数。


6.根据权利要求3所述的方法,其中,所述多任务检测模型的训练步骤还包括:
若该样本图像中的目标仅标注属性,将该样本图像作为输入,将该样本图像中的目标的标注属性作为输出,训练所述多任务检测模型中的属性预测分支网络。


7.根据权利要求6所述的方法,其中,所述属性预测分支网络包括属性预测网络主体和属性分支;以及
所述将该样本图像作为输入,将该样本图像中的目标的标注属性作为输出,训练所述多任务检测模型中的属性预测分支网络,包括:
将该样本图像输入至所述属性预测网络主体,得到该样本图像的属性特征;
将该样本图像的属性特征输入至所述属性分支,得到该样本图像中的目标的预测属性;
基于该样本图像中的目标的预测属性和标注属性,计算属性损失函数;
基于所述属性损失函数调整所述属性预测分支网络的参数。


8.一种图像检测装置,包括:
图像输入模块,被配置成将待检测图像输入至预先训练的多任务检测模型,其中,所述多任务检测模型包括位置检测分支网络和属性预测分支网络;
...

【专利技术属性】
技术研发人员:王康康
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1