物体检测方法、装置及存储介质制造方法及图纸

技术编号:20026588 阅读:24 留言:0更新日期:2019-01-06 05:20
本发明专利技术实施例提出一种物体检测方法、装置及计算机可读存储介质。其中物体检测方法包括:获取输入图像中的目标物体的包围框;根据所述包围框从预先设置的备选框集合中确定出参照框;根据所述参照框与所述包围框的尺寸,生成尺寸相关特征;在机器学习模型中使用所述尺寸相关特征对所述输入图像进行物体检测。本发明专利技术实施例使用与物体的大小相关的特征进行物体检测,即在机器学习模型中在原有特征的基础上增加了物体大小的预测依据,进一步提升了物体检测的准确程度。

【技术实现步骤摘要】
物体检测方法、装置及存储介质
本专利技术涉及信息
,尤其涉及一种物体检测方法、装置及计算机可读存储介质。
技术介绍
物体检测对于人眼来说并不困难,通过对图片中不同颜色、纹理、边缘模块的感知很容易定位出目标物体,但计算机面对的是RGB像素矩阵,很难从图像中直接得到狗和猫这样的抽象概念并定位其位置,再加上物体姿态、光照和复杂背景混杂在一起,使得物体检测更加困难。在计算机视觉领域中,物体检测是经典问题之一,其任务是用框去标出图像中物体的位置,并给出物体的类别。从传统的人工设计特征加浅层分类器的框架,到基于深度学习的端到端的检测框架,物体检测正一步步变得愈加成熟。检测算法里面通常包含三个部分,第一个是检测窗口的选择,第二个是特征的设计,第三个是分类器的设计。其中,特征的设计需要对不同的特征进行组合调优。从不同维度描述物体可以进一步提升检测精度。例如,通过对物体边缘使用直方图统计来进行编码,使特征表达能力更强,在物体检测、跟踪、识别等场景中都有广泛的应用。在检测图像中的物体时,每个候选的物体区域在抽取深度学习网络的特征时,只能得到相同长度的特征,此特征与物体大小没有相关性,缺少物体大小的预测依据,造成物体大小预测不准确。例如,在图像中远处和近处的物体的大小是不一样的,但现有技术的方法中,针对这种大小不一样的物体所提取的特征是一样的,因此造成物体大小预测不准确。
技术实现思路
本专利技术实施例提供一种物体检测方法、装置及计算机可读存储介质,以至少解决现有技术中的一个或多个技术问题。第一方面,本专利技术实施例提供了一种物体检测方法,包括:获取输入图像中的目标物体的包围框;根据所述包围框从预先设置的备选框集合中确定出参照框;根据所述参照框与所述包围框的尺寸,生成尺寸相关特征;在机器学习模型中使用所述尺寸相关特征对所述输入图像进行物体检测。结合第一方面,本专利技术实施例在第一方面的第一种实现方式中,根据所述包围框从预先设置的备选框集合中确定出参照框,包括:计算目标物体的所述包围框与所述备选框集合中的每个备选框的重叠度;根据所述重叠度从所述备选框中选择参照框。结合第一方面的第一种实现方式,本专利技术实施例在第一方面的第二种实现方式中,计算目标物体的所述包围框与所述备选框集合中的每个备选框的重叠度,包括:将所述包围框与所述备选框在一个顶点对齐;计算所述包围框与所述备选框对齐后的交集面积与并集面积的比值;将所述比值作为所述包围框与所述备选框的重叠度。结合第一方面的第一种实现方式,本专利技术实施例在第一方面的第三种实现方式中,根据所述重叠度从所述备选框中选择参照框,包括:若所述包围框与所述备选框的重叠度大于重叠度阈值,则将该备选框确定为参照框。结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式,本专利技术实施例在第一方面的第四种实现方式中,根据所述参照框与所述包围框的尺寸,生成尺寸相关特征,包括:将所述包围框与所述备选框的长度比、宽度比,以及所述长度比的自然对数和所述宽度比的自然对数作为所述尺寸相关特征。结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式,本专利技术实施例在第一方面的第五种实现方式中,还包括:预先设置与物体类别相匹配的备选框集合;预判所述待检测物体的所属的物体类别;根据预判的所述物体类别,选择与所述物体类别相匹配的备选框集合。第二方面,本专利技术实施例提供了一种物体检测装置,包括:包围框获取单元,用于获取输入图像中的目标物体的包围框;参照框确定单元,用于根据所述包围框从预先设置的备选框集合中确定出参照框;尺寸特征生成单元,用于根据所述参照框与所述包围框的尺寸,生成尺寸相关特征;物体检测单元,用于在机器学习模型中使用所述尺寸相关特征对所述输入图像进行物体检测。结合第二方面,本专利技术实施例在第二方面的第一种实现方式中,所述参照框确定单元包括:重叠度计算子单元,用于计算目标物体的所述包围框与所述备选框集合中的每个备选框的重叠度;参照框选择子单元,用于根据所述重叠度从所述备选框中选择参照框。结合第二方面的第一种实现方式,本专利技术实施例在第二方面的第二种实现方式中,所述重叠度计算子单元还用于:将所述包围框与所述备选框在一个顶点对齐;计算所述包围框与所述备选框对齐后的交集面积与并集面积的比值;将所述比值作为所述包围框与所述备选框的重叠度。结合第二方面的第一种实现方式,本专利技术实施例在第二方面的第三种实现方式中,所述参照框选择子单元还用于:若所述包围框与所述备选框的重叠度大于重叠度阈值,则将该备选框确定为参照框。结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式,本专利技术实施例在第二方面的第四种实现方式中,所述尺寸特征生成单元还用于:将所述包围框与所述备选框的长度比、宽度比,以及所述长度比的自然对数和所述宽度比的自然对数作为所述尺寸相关特征。结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式,本专利技术实施例在第二方面的第五种实现方式中,还包括备选框集合选择单元,用于:预先设置与物体类别相匹配的备选框集合;预判所述待检测物体的所属的物体类别;根据预判的所述物体类别,选择与所述物体类别相匹配的备选框集合。在一个可能的设计中,物体检测装置的结构中包括处理器和存储器,所述存储器用于存储支持物体检测装置执行上述第一方面中物体检测方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述物体检测装置还可以包括通信接口,用于物体检测装置与其他设备或通信网络通信。第三方面,本专利技术实施例提供了一种物体检测装置,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述第一方面中任一所述的方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现上述第一方面中任一所述的方法。上述技术方案具有如下优点或有益效果:使用与物体的大小相关的特征进行物体检测,即在机器学习模型中在原有特征的基础上增加了物体大小的预测依据,进一步提升了物体检测的准确程度。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1为本专利技术一实施例提供的物体检测方法的流程图。图2为本专利技术另一实施例提供的物体检测方法的确定参照框的步骤流程图。图3为本专利技术另一实施例提供的物体检测方法的计算重叠度的步骤流程图。图3a为本专利技术另一实施例提供的物体检测方法的重叠度计算中交集面积的示意图。图3b为本专利技术另一实施例提供的物体检测方法的重叠度计算中并集面积的示意图。图4为本专利技术另一实施例提供的物体检测方法的选择备选框集合的步骤流程图。图5为本专利技术一实施例提供的物体检测装置的结构框图。图6为本本文档来自技高网...

【技术保护点】
1.一种物体检测方法,其特征在于,包括:获取输入图像中的目标物体的包围框;根据所述包围框从预先设置的备选框集合中确定出参照框;根据所述参照框与所述包围框的尺寸,生成尺寸相关特征;在机器学习模型中使用所述尺寸相关特征对所述输入图像进行物体检测。

【技术特征摘要】
1.一种物体检测方法,其特征在于,包括:获取输入图像中的目标物体的包围框;根据所述包围框从预先设置的备选框集合中确定出参照框;根据所述参照框与所述包围框的尺寸,生成尺寸相关特征;在机器学习模型中使用所述尺寸相关特征对所述输入图像进行物体检测。2.根据权利要求1所述的方法,其特征在于,根据所述包围框从预先设置的备选框集合中确定出参照框,包括:计算目标物体的所述包围框与所述备选框集合中的每个备选框的重叠度;根据所述重叠度从所述备选框中选择参照框。3.根据权利要求2所述的方法,其特征在于,计算目标物体的所述包围框与所述备选框集合中的每个备选框的重叠度,包括:将所述包围框与所述备选框在一个顶点对齐;计算所述包围框与所述备选框对齐后的交集面积与并集面积的比值;将所述比值作为所述包围框与所述备选框的重叠度。4.根据权利要求2所述的方法,其特征在于,根据所述重叠度从所述备选框中选择参照框,包括:若所述包围框与所述备选框的重叠度大于重叠度阈值,则将该备选框确定为参照框。5.根据权利要求1-4中任一项所述的方法,其特征在于,根据所述参照框与所述包围框的尺寸,生成尺寸相关特征,包括:将所述包围框与所述备选框的长度比、宽度比,以及所述长度比的自然对数和所述宽度比的自然对数作为所述尺寸相关特征。6.根据权利要求1-4中任一项所述的方法,其特征在于,还包括:预先设置与物体类别相匹配的备选框集合;预判所述待检测物体的所属的物体类别;根据预判的所述物体类别,选择与所述物体类别相匹配的备选框集合。7.一种物体检测装置,其特征在于,包括:包围框获取单元,用于获取输入图像中的目标物体的包围框;参照框确定单元,用于根据所述包围框从预先设置的备选框集合中确定出参照框;尺寸特征生成单...

【专利技术属性】
技术研发人员:王学辉李明夏添
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1