物体检测方法、模型训练方法、装置及电子设备制造方法及图纸

技术编号:29874054 阅读:45 留言:0更新日期:2021-08-31 23:49
本公开提供了一种物体检测方法、模型训练方法、装置及电子设备,涉及计算机视觉、深度学习等人工智能技术领域。具体实现方案为:获取待检测图像;对所述待检测图像进行物体检测,得到所述待检测图像的第一物体检测信息;对所述待检测图像进行场景检测,以获取所述待检测图像的目标场景检测信息,所述目标场景检测信息包括所述待检测图像对应的目标场景类别;获取所述目标场景类别对应的场景识别模型;基于所述场景识别模型和所述第一物体检测信息,确定所述待检测图像的第二物体检测信息。根据本公开的技术,解决了物体检测技术中存在的物体检测效果比较差的问题,提高了物体检测的效果。

【技术实现步骤摘要】
物体检测方法、模型训练方法、装置及电子设备
本公开涉及人工智能
,尤其涉及计算机视觉、深度学习
,具体涉及一种物体检测方法、模型训练方法、装置及电子设备。
技术介绍
随着人工智能的高速发展,越来越多的应用场景可以基于深度学习的物体检测技术来解决实际问题,比如针对零售行业巡检的应用场景、农作物无人机巡检的应用场景和工业标准零件流水线检测的应用场景等。在这些应用场景中,待检测图像中通常包括多个检测场景,使得一个物体检测应用往往需要同时处理多个检测场景的数据。目前,物体检测应用通常仅集成单一的深度学习模型,通过集成的深度学习模型来对存在多个检测场景的物体进行检测。
技术实现思路
本公开提供了一种物体检测方法、模型训练方法、装置及电子设备。根据本公开的第一方面,提供了一种物体检测方法,包括:获取待检测图像;对所述待检测图像进行物体检测,得到所述待检测图像的第一物体检测信息;对所述待检测图像进行场景检测,以获取所述待检测图像的目标场景检测信息,所述目标场景检测信息包括所述待检测图像对应的目标场景类别;获取所述目标场景类别对应的场景识别模型;基于所述场景识别模型和所述第一物体检测信息,确定所述待检测图像的第二物体检测信息。根据本公开的第二方面,提供了一种模型训练方法,包括:获取目标数据,所述目标数据包括行业场景库中目标场景类别下的场景图像样本数据,和/或,输入的所述目标场景类别下的物体图像样本数据,所述目标场景类别为对待检测图像进行场景检测所获取的目标场景检测信息中的场景类别;基于所述目标数据对所述目标场景类别对应的场景识别模型进行训练;其中,所述场景识别模型用于结合第一物体检测信息确定所述待检测图像的第二物体检测信息,所述第一物体检测信息为对所述待检测图像进行物体检测得到的物体检测信息。根据本公开的第三方面,提供了一种物体检测装置,包括:第一获取模块,用于获取待检测图像;物体检测模块,用于对所述待检测图像进行物体检测,得到所述待检测图像的第一物体检测信息;场景检测模块,用于对所述待检测图像进行场景检测,以获取所述待检测图像的目标场景检测信息,所述目标场景检测信息包括所述待检测图像对应的目标场景类别;第二获取模块,用于获取所述目标场景类别对应的场景识别模型;确定模块,用于基于所述场景识别模型和所述第一物体检测信息,确定所述待检测图像的第二物体检测信息。根据本公开的第四方面,提供了一种模型训练装置,包括:第五获取模块,用于获取目标数据,所述目标数据包括目标场景类别下的场景图像样本数据,所述目标场景类别为对待检测图像进行场景检测所获取的目标场景检测信息中的场景类别;第一训练模块,用于基于所述目标数据对所述目标场景类别对应的场景识别模型进行训练;其中,所述场景识别模型用于结合第一物体检测信息确定所述待检测图像的第二物体检测信息,所述第一物体检测信息为对所述待检测图像进行物体检测得到的物体检测信息。根据本公开的第五方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器能够执行第一方面中的任一项方法,或者执行第二方面中的任一项方法。根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行第一方面中的任一项方法,或者执行第二方面中的任一项方法。根据本公开的第七方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现第一方面中的任一项方法,或者实现第二方面中的任一项方法。根据本公开的技术解决了物体检测技术中存在的物体检测效果比较差的问题,提高了物体检测的效果。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本公开的限定。其中:图1是根据本公开第一实施例的物体检测方法的流程示意图;图2是待检测图像中物体框的标识示意图;图3是物体检测平台中的模型结构示意图;图4是待检测图像中场景框的标识示意图;图5是货架场景的标识示意图;图6是物体检测平台中物体检测的整体流程示意图;图7是根据本公开第二实施例的模型训练方法的流程示意图;图8是根据本公开第三实施例的物体检测装置的结构示意图;图9是根据本公开第四实施例的模型训练装置的结构示意图;图10示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。具体实施方式以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。第一实施例如图1所示,本公开提供一种物体检测方法,包括如下步骤:步骤S101:获取待检测图像。本实施例中,物体检测方法涉及人工智能技术,具体涉及计算机视觉、深度学习
,其可以广泛应用于针对零售行业巡检、农作物无人机巡检和工业标准零件流水线检测等应用场景中。该方法可以由本公开实施例的物体检测装置执行。而物体检测装置可以配置在任意电子设备中,以执行本公开实施例的物体检测方法,该电子设备可以为服务器,也可以为终端,这里不做具体限定。所述待检测图像可以为包括物体图像内容和物体场景图像内容的图像,所述物体图像内容所涉及的物体包括至少一个,所述物体场景图像内容所涉及的场景也可以包括至少一种。比如,针对零售行业巡检的应用场景,待检测图像中图像内容所涉及的场景可以包括货架场景和地堆场景等。又比如,针对农作物无人机巡检的应用场景,待检测图像中图像内容所涉及的场景可以包括梯田场景、水田场景、玉米农作物场景和水稻农作物场景等。本实施例的目的即是对待检测图像进行物体检测,以确定待检测图像中的物体在实际场景中的相关信息,从而可以基于检测出的相关信息进行相应的应用。比如,针对零售行业巡检的应用场景,可以检测商品在货架上的层数、该商品在该层中的排面占比以及该商品在货架上排放的饱满度等,这样可以根据商品在货架上的层数对该商品进行自动售卖,根据售卖情况调整其排面占比,以及根据饱满度进行商品排放。又比如,可以检测地堆场景的商品实际堆放的数量以及商品摆放纵深,这样可以减少清点商品的人工成本。所述待检测图像的获取方式可以包括多种,比如,可以采用摄像头实时采集图像,将其作为待检测图像,也可以获取预先存储的待检测图像,还可以从网本文档来自技高网
...

【技术保护点】
1.一种物体检测方法,包括:/n获取待检测图像;/n对所述待检测图像进行物体检测,得到所述待检测图像的第一物体检测信息;/n对所述待检测图像进行场景检测,以获取所述待检测图像的目标场景检测信息,所述目标场景检测信息包括所述待检测图像对应的目标场景类别;/n获取所述目标场景类别对应的场景识别模型;/n基于所述场景识别模型和所述第一物体检测信息,确定所述待检测图像的第二物体检测信息。/n

【技术特征摘要】
1.一种物体检测方法,包括:
获取待检测图像;
对所述待检测图像进行物体检测,得到所述待检测图像的第一物体检测信息;
对所述待检测图像进行场景检测,以获取所述待检测图像的目标场景检测信息,所述目标场景检测信息包括所述待检测图像对应的目标场景类别;
获取所述目标场景类别对应的场景识别模型;
基于所述场景识别模型和所述第一物体检测信息,确定所述待检测图像的第二物体检测信息。


2.根据权利要求1所述的方法,其中,所述基于所述场景识别模型和所述第一物体检测信息,确定所述待检测图像的第二物体检测信息,包括:
基于所述场景识别模型对所述待检测图像进行场景识别,得到所述目标场景类别下的场景识别信息,所述场景识别信息用于表征所述目标场景类别对应的场景框中物体的场景环境;
对所述第一物体检测信息和所述场景识别信息进行融合处理,得到所述第二物体检测信息。


3.根据权利要求1所述的方法,其中,所述对所述待检测图像进行场景检测,以获取所述待检测图像的目标场景检测信息,包括:
基于场景检测模型对所述待检测图像进行场景检测,以获取所述待检测图像的目标场景检测信息;所述场景检测模型为基于行业场景库中行业类别下的场景图像样本数据训练得到的模型,所述行业场景库包括M个行业类别下的场景图像样本数据,M为正整数。


4.根据权利要求3所述的方法,其中,所述基于场景检测模型对所述待检测图像进行场景检测,以获取所述待检测图像的目标场景检测信息之前,所述方法还包括:
获取所述待检测图像对应的目标行业类别;
从预设场景检测模型中获取所述目标行业类别对应的所述场景检测模型。


5.根据权利要求3所述的方法,其中,所述行业场景库包括每个行业类别对应的N个场景类别下的场景图像样本数据,N为正整数,所述场景识别模型为基于目标数据训练得到的模型,所述目标数据包括所述行业场景库中所述目标行业类别的所述目标场景类别下的场景图像样本数据,和/或,输入的所述目标场景类别下的物体图像样本数据。


6.一种模型训练方法,包括:
获取目标数据,所述目标数据包括目标场景类别下的场景图像样本数据,所述目标场景类别为对待检测图像进行场景检测所获取的目标场景检测信息中的场景类别;
基于所述目标数据对所述目标场景类别对应的场景识别模型进行训练;
其中,所述场景识别模型用于结合第一物体检测信息确定所述待检测图像的第二物体检测信息,所述第一物体检测信息为对所述待检测图像进行物体检测得到的物体检测信息。


7.根据权利要求6所述的方法,其中,所述目标场景类别为基于场景检测模型对待检测图像进行场景检测所获取的目标场景检测信息中的场景类别,所述目标场景类别为目标行业类别下的场景类别,所述目标行业类别为所述待检测图像对应的行业类别;
所述方法还包括:
从行业场景库中获取所述目标行业类别下的场景图像样本数据;
基于所述目标行业类别下的场景图像样本数据对所述场景检测模型进行训练,其中,所述行业场景库包括M个行业类别下的场景图像样本数据,所述M个行业类别包括所述目标行业类别,M为正整数。


8.一种物体检测装置,包括:
第一获取模块,用于获取待检测图像;
物体检测模块,用于对所述待检测图像进行物体检测,得到所述待检测图像的第一物体检测信息;
场景检测模块,用于对所述待检测图像进行场景检测,以获取所述待检测图像的目标场景检测信息,所述目标场景检测信息包括所述待检测图像对应的目标场景类别;
第二获取模块,用于获...

【专利技术属性】
技术研发人员:钱正宇袁正雄李金麒褚振方黄悦李润青胡鸣人施恩
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1