基于图像的物体检测方法、装置及服务器制造方法及图纸

技术编号:14756390 阅读:104 留言:0更新日期:2017-03-02 22:57
本公开是关于基于图像的物体检测方法、装置及服务器,该方法包括:对图像中的物体进行检测,得到所述图像中包含的各类物体的频次向量;基于字典学习的方法对所述频次向量进行编码,将得到的编码值作为物体检测的结果。应用本公开实施例,与相关技术中直接将物体在图像中出现的频率作为检测结果所不同的是,通过字典学习的方法,获取图像中各个物体的频次向量,并利用编码对以频次向量所表示的检测结果进行修正,从而降低误检率和漏检率,提高检测准确率和完整性。

【技术实现步骤摘要】

本公开涉及图像处理
,尤其涉及一种基于图像的物体检测方法、装置及服务器
技术介绍
物体检测指的是对图像中的物体进行检测和识别,通过物体检测能够确定图像拍摄的场景,从而为图像分类提供依据,例如,包含办公桌的图像通常被归类为办公室图像。相关技术中,通过SVM(SupportVectorMachine,支持向量机)对图像中的物体进行检测,从而得到图像中的各类物体出现的概率。由于SVM的权重向量的个数较少,赋予SVM的学习能力有限,因而检测精度不高,误检率和漏检率较高。
技术实现思路
为克服相关技术中存在的问题,本公开提供了一种基于图像的物体检测方法、装置及服务器。根据本公开实施例的第一方面,提供一种基于图像的物体检测方法,该方法可以包括:在一实施例中,对图像中的物体进行检测,得到所述图像中包含的各类物体的频次向量;基于字典学习的方法对所述频次向量进行编码,将得到的编码值作为物体检测的结果。在一实施例中,所述对图像中的物体进行检测,得到所述图像中包含的各类物体的频次向量,包括:遍历所述图像,确定包含图像中的物体的多个窗口;确定各所述多个窗口中出现物体的概率;基于所述概率对所述多个窗口进行筛除处理,将剩下的窗口确定为目标窗口;识别所述目标窗口中的物体,确定所述物体的类别;确定每类物体在所述图像中出现的次数,得到各类物体的频次向量。在一实施例中,所述遍历所述图像,包括:通过滑动窗口的方式遍历所述图像。在一实施例中,所述对所述多个窗口进行筛除处理,包括:确定各所述多个窗口的概率是否低于设定概率阈值;将所述多个窗口中概率低于所述设定概率阈值的窗口确定为第一窗口;去除所述第一窗口。在一实施例中,所述对所述多个窗口进行筛除处理,包括:对于所述多个窗口中具有重合的两个窗口,确定所述两个窗口的交集面积和并集面积;计算所述交集面积和并集面积的比值;在所述比值大于设定比值阈值时,去除所述两个窗口中概率较低的窗口,保留所述两个窗口中概率较高的窗口;在所述比值不大于所述设定比值阈值时,保留所述两个窗口。在一实施例中,所述基于字典学习的方法对所述频次向量进行编码,包括:确定用于表示至少两类物体在图像中同时出现的关联性的字典值,所述字典值为常量;基于所述字典值、所述频次向量以及所述编码的编码值确定用于表示编码误差的第一值;计算使得第一值最小的编码值。在一实施例中,所述基于字典学习的方法对所述频次向量进行编码,包括:确定用于表示至少两类物体在图像中同时出现的关联性的字典值;基于所述字典值、所述频次向量以及所述编码的编码值确定用于表示编码误差的第一值;设定元参数;基于所述元参数和所述编码值确定用于表示编码值的稀疏以及用于调节所述编码误差的第二值;计算使得所述第一值和所述第二值的和最小的编码值。在一实施例中,所述计算使得所述第一值和所述第二值的和最小的编码值,包括:通过下式计算使得所述第一值和所述第二值的和最小的编码值:其中,为所述第一值,λ||xi||1为所述第二值,yi表示对第i个物体进行检测的检测结果,D表示用于表示至少两类物体在图像中同时出现的关联性的字典值,xi表示与各个yi对应的编码值,λ表示元参数。在一实施例中,所述元参数的取值范围包括10-3-103。根据本公开实施例的第二方面,提供一种基于图像的物体检测装置,包括:检测模块,被配置为对图像中的物体进行检测,得到所述图像中包含的各类物体的频次向量;编码模块,被配置为基于字典学习的方法对所述检测模块得到的所述频次向量进行编码,将得到的编码值作为物体检测的结果。在一实施例中,所述检测模块包括:遍历子模块,被配置为遍历所述图像,确定包含图像中的物体的多个窗口;第一确定子模块,被配置为确定各所述多个窗口中出现物体的概率;处理子模块,被配置为基于所述概率对所述多个窗口进行筛除处理,将剩下的窗口确定为目标窗口;识别子模块,被配置为识别所述目标窗口中的物体,确定所述物体的类别;第二确定子模块,被配置为确定每类物体在所述图像中出现的次数,得到各类物体的频次向量。在一实施例中,所述遍历子模块包括:第一遍历子模块,被配置为通过滑动窗口的方式遍历所述图像。在一实施例中,所述处理子模块包括:第三确定子模块,被配置为确定各所述多个窗口的概率是否低于设定概率阈值;第四确定子模块,被配置为将所述多个窗口中概率低于所述设定概率阈值的窗口确定为第一窗口;第一去除子模块,被配置为去除所述第一窗口。在一实施例中,所述处理子模块包括:第五确定子模块,被配置为对于所述多个窗口中具有重合的两个窗口,确定所述两个窗口的交集面积和并集面积;第一计算子模块,被配置为计算所述交集面积和并集面积的比值;第二去除子模块,被配置为在所述比值大于设定比值阈值时,去除所述两个窗口中概率较低的窗口,保留所述两个窗口中概率较高的窗口;保留子模块,被配置为在所述比值不大于所述设定比值阈值时,保留所述两个窗口。在一实施例中,所述编码模块包括:第六确定子模块,被配置为确定用于表示至少两类物体在图像中同时出现的关联性的字典值,所述字典值为常量;第七确定子模块,被配置为基于所述字典值、所述频次向量以及所述编码的编码值确定用于表示编码误差的第一值;第二计算子模块,被配置为计算使得第一值最小的编码值。在一实施例中,所述编码模块包括:第八确定子模块,被配置为确定用于表示至少两类物体在图像中同时出现的关联性的字典值;第九确定子模块,被配置为基于所述字典值、所述频次向量以及所述编码的编码值确定用于表示编码误差的第一值;设定子模块,被配置为设定元参数;第十确定子模块,被配置为基于所述元参数和所述编码值确定用于表示编码值的稀疏以及用于调节所述编码误差的第二值;第三计算子模块,被配置为计算使得所述第一值和所述第二值的和最小的编码值。在一实施例中,所述第三计算子模块通过下式计算使得所述第一值和所述第二值的和最小的编码值:其中,为所述第一值,λ||xi||1为所述第二值,yi表示对第i个物体进行检测的检测结果,D表示用于表示至少两类物体在图像中同时出现的关联性的字典值,xi表示与各个yi对应的编码值,λ表示元参数。在一实施例中,所述元参数的取值范围包括10-3-103。根据本公开实施例的第三方面,提供一种服务器,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:对图像中的物体进行检测,得到所述图像中包含的各类物体的频次向量;基于字典学习的方法对所述频次向量进行编码,将得到的编码值作为物体检测的结果。本公开的实施例提供的技术方案可以包括以下有益效果:本公开中与相关技术中直接将物体在图像中出现的频率作为检测结果所不同的是,服务器可以通过字典学习的方法,获取图像中各个物体的频次向量,并利用编码对以频次向量所表示的检测结果进行修正,从而降低误检率和漏检率,提高检测准确率和完整性。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1是本公开根据一示例性实施例示出的一种基于图像的物体检测方法流程图。图2A是本公开根据一示例性实施例示出的另一种基于图像的物体检测方法流程图。图2B是本公开根据本文档来自技高网...
基于图像的物体检测方法、装置及服务器

【技术保护点】
一种基于图像的物体检测方法,其特征在于,包括:对图像中的物体进行检测,得到所述图像中包含的各类物体的频次向量;基于字典学习的方法对所述频次向量进行编码,将得到的编码值作为物体检测的结果。

【技术特征摘要】
1.一种基于图像的物体检测方法,其特征在于,包括:对图像中的物体进行检测,得到所述图像中包含的各类物体的频次向量;基于字典学习的方法对所述频次向量进行编码,将得到的编码值作为物体检测的结果。2.根据权利要求1所述的方法,其特征在于,所述对图像中的物体进行检测,得到所述图像中包含的各类物体的频次向量,包括:遍历所述图像,确定包含图像中的物体的多个窗口;确定各所述多个窗口中出现物体的概率;基于所述概率对所述多个窗口进行筛除处理,将剩下的窗口确定为目标窗口;识别所述目标窗口中的物体,确定所述物体的类别;确定每类物体在所述图像中出现的次数,得到各类物体的频次向量。3.根据权利要求2所述的方法,其特征在于,所述遍历所述图像,包括:通过滑动窗口的方式遍历所述图像。4.根据权利要求2所述的方法,其特征在于,所述对所述多个窗口进行筛除处理,包括:确定各所述多个窗口的概率是否低于设定概率阈值;将所述多个窗口中概率低于所述设定概率阈值的窗口确定为第一窗口;去除所述第一窗口。5.根据权利要求2所述的方法,其特征在于,所述对所述多个窗口进行筛除处理,包括:对于所述多个窗口中具有重合的两个窗口,确定所述两个窗口的交集面积和并集面积;计算所述交集面积和并集面积的比值;在所述比值大于设定比值阈值时,去除所述两个窗口中概率较低的窗口,保留所述两个窗口中概率较高的窗口;在所述比值不大于所述设定比值阈值时,保留所述两个窗口。6.根据权利要求1所述的方法,其特征在于,所述基于字典学习的方法对所述频次向量进行编码,包括:确定用于表示至少两类物体在图像中同时出现的关联性的字典值,所述字典值为常量;基于所述字典值、所述频次向量以及所述编码的编码值确定用于表示编码误差的第一值;计算使得第一值最小的编码值。7.根据权利要求1所述的方法,其特征在于,所述基于字典学习的方法对所述频次向量进行编码,包括:确定用于表示至少两类物体在图像中同时出现的关联性的字典值;基于所述字典值、所述频次向量以及所述编码的编码值确定用于表示编码误差的第一值;设定元参数;基于所述元参数和所述编码值确定用于表示编码值的稀疏以及用于调节所述编码误差的第二值;计算使得所述第一值和所述第二值的和最小的编码值。8.根据权利要求7所述的方法,其特征在于,所述计算使得所述第一值和所述第二值的和最小的编码值,包括:通过下式计算使得所述第一值和所述第二值的和最小的编码值:minD,XΣi=1N||yi-Dxi||22+λ||xi||1]]>其中,为所述第一值,λ||xi||1为所述第二值,yi表示对第i个物体进行检测的检测结果,D表示用于表示至少两类物体在图像中同时出现的关联性的字典值,xi表示与各个yi对应的编码值,λ表示元参数。9.根据权利要求6-8任一项所述的方法,其特征在于,所述元参数的取值范围包括10-3-103。10.一种基于图像的物体检测装置,其特征在于,包括:检测模块,被配置为对图像中的物体进行检测,得到所述图像中包含的各类物体的频次向量;编码模块,被配置为基于字典学习的方法对所述检测模块得到的所述频次向量进行编码,将得到的编码值作为物体检测的结果。11.根据权利要求10所述的装置,其特征在于,所述检测模块包...

【专利技术属性】
技术研发人员:万韶华张旭华杨松
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1