【技术实现步骤摘要】
本公开涉及图像处理
,尤其涉及一种基于图像的物体检测方法、装置及服务器。
技术介绍
物体检测指的是对图像中的物体进行检测和识别,通过物体检测能够确定图像拍摄的场景,从而为图像分类提供依据,例如,包含办公桌的图像通常被归类为办公室图像。相关技术中,通过SVM(SupportVectorMachine,支持向量机)对图像中的物体进行检测,从而得到图像中的各类物体出现的概率。由于SVM的权重向量的个数较少,赋予SVM的学习能力有限,因而检测精度不高,误检率和漏检率较高。
技术实现思路
为克服相关技术中存在的问题,本公开提供了一种基于图像的物体检测方法、装置及服务器。根据本公开实施例的第一方面,提供一种基于图像的物体检测方法,该方法可以包括:在一实施例中,对图像中的物体进行检测,得到所述图像中包含的各类物体的频次向量;基于字典学习的方法对所述频次向量进行编码,将得到的编码值作为物体检测的结果。在一实施例中,所述对图像中的物体进行检测,得到所述图像中包含的各类物体的频次向量,包括:遍历所述图像,确定包含图像中的物体的多个窗口;确定各所述多个窗口中出现物体的概率;基于所述概率对所述多个窗口进行筛除处理,将剩下的窗口确定为目标窗口;识别所述目标窗口中的物体,确定所述物体的类别;确定每类物体在所述图像中出现的次数,得到各类物体的频次向量。在一实施例中,所述遍历所述图像,包括:通过滑动窗口的方式遍历所述图像。在一实施例中,所述对所述多个窗口进行筛除处理,包括:确定各所述多个窗口的概率是否低于设定概率阈值;将所述多个窗口中概率低于所述设定概率阈值的窗口确定为第一窗口;去除 ...
【技术保护点】
一种基于图像的物体检测方法,其特征在于,包括:对图像中的物体进行检测,得到所述图像中包含的各类物体的频次向量;基于字典学习的方法对所述频次向量进行编码,将得到的编码值作为物体检测的结果。
【技术特征摘要】
1.一种基于图像的物体检测方法,其特征在于,包括:对图像中的物体进行检测,得到所述图像中包含的各类物体的频次向量;基于字典学习的方法对所述频次向量进行编码,将得到的编码值作为物体检测的结果。2.根据权利要求1所述的方法,其特征在于,所述对图像中的物体进行检测,得到所述图像中包含的各类物体的频次向量,包括:遍历所述图像,确定包含图像中的物体的多个窗口;确定各所述多个窗口中出现物体的概率;基于所述概率对所述多个窗口进行筛除处理,将剩下的窗口确定为目标窗口;识别所述目标窗口中的物体,确定所述物体的类别;确定每类物体在所述图像中出现的次数,得到各类物体的频次向量。3.根据权利要求2所述的方法,其特征在于,所述遍历所述图像,包括:通过滑动窗口的方式遍历所述图像。4.根据权利要求2所述的方法,其特征在于,所述对所述多个窗口进行筛除处理,包括:确定各所述多个窗口的概率是否低于设定概率阈值;将所述多个窗口中概率低于所述设定概率阈值的窗口确定为第一窗口;去除所述第一窗口。5.根据权利要求2所述的方法,其特征在于,所述对所述多个窗口进行筛除处理,包括:对于所述多个窗口中具有重合的两个窗口,确定所述两个窗口的交集面积和并集面积;计算所述交集面积和并集面积的比值;在所述比值大于设定比值阈值时,去除所述两个窗口中概率较低的窗口,保留所述两个窗口中概率较高的窗口;在所述比值不大于所述设定比值阈值时,保留所述两个窗口。6.根据权利要求1所述的方法,其特征在于,所述基于字典学习的方法对所述频次向量进行编码,包括:确定用于表示至少两类物体在图像中同时出现的关联性的字典值,所述字典值为常量;基于所述字典值、所述频次向量以及所述编码的编码值确定用于表示编码误差的第一值;计算使得第一值最小的编码值。7.根据权利要求1所述的方法,其特征在于,所述基于字典学习的方法对所述频次向量进行编码,包括:确定用于表示至少两类物体在图像中同时出现的关联性的字典值;基于所述字典值、所述频次向量以及所述编码的编码值确定用于表示编码误差的第一值;设定元参数;基于所述元参数和所述编码值确定用于表示编码值的稀疏以及用于调节所述编码误差的第二值;计算使得所述第一值和所述第二值的和最小的编码值。8.根据权利要求7所述的方法,其特征在于,所述计算使得所述第一值和所述第二值的和最小的编码值,包括:通过下式计算使得所述第一值和所述第二值的和最小的编码值:minD,XΣi=1N||yi-Dxi||22+λ||xi||1]]>其中,为所述第一值,λ||xi||1为所述第二值,yi表示对第i个物体进行检测的检测结果,D表示用于表示至少两类物体在图像中同时出现的关联性的字典值,xi表示与各个yi对应的编码值,λ表示元参数。9.根据权利要求6-8任一项所述的方法,其特征在于,所述元参数的取值范围包括10-3-103。10.一种基于图像的物体检测装置,其特征在于,包括:检测模块,被配置为对图像中的物体进行检测,得到所述图像中包含的各类物体的频次向量;编码模块,被配置为基于字典学习的方法对所述检测模块得到的所述频次向量进行编码,将得到的编码值作为物体检测的结果。11.根据权利要求10所述的装置,其特征在于,所述检测模块包...
【专利技术属性】
技术研发人员:万韶华,张旭华,杨松,
申请(专利权)人:北京小米移动软件有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。