一种物体识别方法和装置制造方法及图纸

技术编号:35152256 阅读:18 留言:0更新日期:2022-10-05 10:31
本发明专利技术提供一种物体识别方法和装置,所述物体识别方法包括:获取待识别图像;利用预设的图像分割方法对所述待识别图像进行处理,得到第一预测结果;基于所述第一预测结果,通过对预设优化模型的目标函数求最优解来获得第二预测结果,其中,所述预设优化模型的目标函数以最大化所述目标物体识别框的多个角点、所述目标物体所处的场景类别以及所述目标物体语义的概率热力之和为目标;以及基于所述第二预测结果获得目标物体识别信息。本发明专利技术的方法和装置利用预设的优化模型对识别结果进行优化,解决了通用物体检测不兼容、通用物体检测识别准召率低的问题,并且能够利用该识别结果作为分析数据以支持设计、召回等进一步应用。作为分析数据以支持设计、召回等进一步应用。作为分析数据以支持设计、召回等进一步应用。

【技术实现步骤摘要】
一种物体识别方法和装置


[0001]本专利技术涉及计算机领域,具体涉及一种物体识别方法和装置。

技术介绍

[0002]目前,利用人工智能识别图像中的物体的技术已经在各个领域进行了尝试和应用,其大多都是通过得到识别框来达到识别物体的目的。
[0003]在各种领域中,除了获得物体的识别框,能够获得物体更多的高级语义的需求越来越迫切。例如,在房产领域中,除了识别户型图中所显示的户型布局,如果还能够精确识别其中的家具、布局关系和更多高级语义,就能更全面地掌握房屋的内部情况,也能利用该识别结果作为分析数据以支持更深入的家装、设计、召回等应用。
[0004]因此,需要一种能够提供更多高级语义的物体识别方法和装置,从而克服上述问题。
[0005]需要说明的是,以上
技术介绍
部分所公开的信息仅用于增强对本专利技术背景的理解,因此其可能包含不构成对本领域技术人员已知的现有技术的信息。

技术实现思路

[0006]为了解决现有技术中存在的问题,本专利技术提供一种物体识别方法和装置,其通过设计了优化模型来对识别出的物体进行进一步筛选,不仅能够得到物体的位置和语义,还能得到物体所处的场景、布局关系和尺寸等高级语义信息。
[0007]本专利技术提供一种物体识别方法,包括:获取待识别图像;利用预设的图像分割方法对所述待识别图像进行处理,得到第一预测结果,所述第一预测结果包括目标物体识别框及所述目标物体识别框的多个角点、目标物体语义和场景类别;基于所述第一预测结果,通过对预设优化模型的目标函数求最优解来获得第二预测结果,其中,所述预设优化模型的目标函数以最大化所述目标物体识别框的多个角点、所述目标物体所处的场景类别以及所述目标物体语义的概率热力之和为目标;以及基于所述第二预测结果获得目标物体识别信息。
[0008]根据本专利技术一实施例,所述预设优化模型为整数规划模型,其目标函数通过下式表示:
[0009][0010]其中,表示目标物体识别框的多个角点的概率热力;表示目标物体所处的场景类别以及目标物体语义的概率热力之和;式中,P(j)代表包含角点j的目标物体识别框;W
P
代表全局超参数;
代表P(j)的权值;S(s,i)代表包含场景类别和目标物体语义的场景;W
Icon
代表目标物体语义的全局超参数;代表目标物体语义的概率热力;W
Scene
代表场景类别的全局超参数;代表目标物体所处的场景类别的概率热力。
[0011]根据本专利技术一实施例,所述预设优化模型的约束条件包括以下中的一项或多项:
[0012]近邻约束:(P(i)+P(k))≤1,其表示两个不同的目标物体识别框P(i)和P(k)之间的重叠率不能大于第一预设阈值;
[0013]独热约束:其表示目标物体识别框P(p)只能取一种目标物体语义I
p
(i),其中Set
icon
表示预设目标物体语义;
[0014]互斥约束:(I(m)+I(k))≤1,其表示重叠率大于所述第一预设阈值的非堆叠目标物体的目标物体语义I(m)和I(k)互斥;
[0015]主从约束:其表示重叠率大于所述第一预设阈值的可堆叠目标物体的副目标物体语义I(Sub)小于所有相交主目标物体语义I(main)之和,其中Set
icon
表示预设目标物体语义;
[0016]数量约束:其表示场景类型S
icon
(s)中出现的目标物体的数量Number
scene
小于第二预设阈值,其中Set
scene
表示预设场景类别。
[0017]根据本专利技术一实施例,所述物体识别方法还包括:对所述第一预测结果进行数据过滤;其中,所述基于第一预测结果,通过对预设优化模型的目标函数求最优解来获得第二预测结果的步骤中,所述第一预测结果经过所述数据过滤处理。
[0018]根据本专利技术一实施例,所述第一预测结果还包括目标物体尺寸,对所述第一预测结果进行数据过滤包括:将所述目标物体尺寸与预设尺寸之间的差值大于第三预设阈值的目标物体语义或目标物体识别框过滤掉。
[0019]根据本专利技术一实施例,所述第一预测结果还包括隔断热力图和附件热力图,所述目标物体尺寸通过以下步骤得到:利用OCR检测所述待识别图像上的标注尺寸,获得第一缩放比例;利用所述隔断热力图和穿线法得到隔断缩放比例;利用所述附件热力图得到附件缩放比例;采用预设算法对所述第一缩放比例、所述隔断缩放比例和所述附件缩放比例进行合并,得到第二缩放比例;以及基于所述第二缩放比例计算所述目标物体尺寸。
[0020]根据本专利技术一实施例,所述预设算法为计算所述第一缩放比例、所述隔断缩放比例和所述附件缩放比例的概率密度分布,并将其中概率最大的缩放比例作为第二缩放比例。
[0021]根据本专利技术一实施例,所述预设算法为取所述第一缩放比例、所述隔断缩放比例和所述附件缩放比例的中位数,并将其作为第二缩放比例。
[0022]根据本专利技术一实施例,所述第一预测结果还包括目标物体热力图,对所述第一预测结果进行数据过滤还包括:基于所述目标物体热力图计算目标物体的像素分割概率统计值,并将所述目标物体的像素分割概率统计值小于第一预设概率的像素过滤掉。
[0023]根据本专利技术一实施例,所述目标物体的像素分割概率统计值通过计算以下数值中
的一个或多个得到:所述目标物体的像素分割概率的均值、最大值、中位数。
[0024]根据本专利技术一实施例,所述第一预测结果还包括场景布局热力图,对所述第一预测结果进行数据过滤还包括:基于所述场景布局热力图,计算所述目标物体识别框所在位置的所述场景布局的像素分割概率统计值,并将所述目标物体识别框所在位置的所述场景布局的像素分割概率统计值小于第二预设概率的像素过滤掉。
[0025]根据本专利技术一实施例,所述目标物体识别框所在位置的所述场景布局的像素分割概率统计值通过计算以下数值中的一个或多个得到:所述目标物体识别框所在位置的所述场景布局的像素分割概率的均值、最大值、中位数。
[0026]根据本专利技术一实施例,所述目标物体识别信息包括以下中的一项或多项:场景信息、尺寸信息、组合关系信息。
[0027]根据本专利技术一实施例,所述目标物体识别框为矩形框。
[0028]根据本专利技术一实施例,所述矩形框通过处于对角位置上的两个角点得到。
[0029]根据本专利技术的另一方面,还提供一种物体识别装置,包括:获取模块,其被配置为:获取待识别图像;图像分割模块,其被配置为:利用预设的图像分割方法对所述待识别图像进行处理,得到第一预测结果,所述第一预测结果包括目标物体识别框及所述目标物体识别框的多个角点、目标物体语义和场景类别;优化模块,其被配置为:基于所述第一预测结果,通过对预设优化模型的目标函数求最优解来获得第二预测结果,其中,所述预设优化模型的目标函数以最大化所述目标物体识别框的多个角点、所述目标物体所处的场景类别以及所述目标物本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种物体识别方法,其特征在于,包括:获取待识别图像;利用预设的图像分割方法对所述待识别图像进行处理,得到第一预测结果,所述第一预测结果包括目标物体识别框及所述目标物体识别框的多个角点、目标物体语义和场景类别;基于所述第一预测结果,通过对预设优化模型的目标函数求最优解来获得第二预测结果,其中,所述预设优化模型的目标函数以最大化所述目标物体识别框的多个角点、所述目标物体所处的场景类别以及所述目标物体语义的概率热力之和为目标;以及基于所述第二预测结果获得目标物体识别信息。2.据权利要求1所述的方法,其特征在于,所述预设优化模型为整数规划模型,其目标函数通过下式表示:其中,表示目标物体识别框的多个角点的概率热力;表示目标物体所处的场景类别以及目标物体语义的概率热力之和;式中,P(j)代表包含角点j的目标物体识别框;W
P
代表全局超参数;代表P(j)的权值;S(s,i)代表包含场景类别和目标物体语义的场景;W
Icon
代表目标物体语义的全局超参数;代表目标物体语义的概率热力;W
Scene
代表场景类别的全局超参数;代表目标物体所处的场景类别的概率热力。3.据权利要求2所述的方法,其特征在于,所述预设优化模型的约束条件包括以下中的一项或多项:近邻约束:(P(i)+P(k))≤1,其表示两个不同的目标物体识别框P(i)和P(k)之间的重叠率不能大于第一预设阈值;独热约束:其表示目标物体识别框P(p)只能取一种目标物体语义I
p
(i),其中Set
icon
表示预设目标物体语义;互斥约束:(I(m)+I(k))≤1,其表示重叠率大于所述第一预设阈值...

【专利技术属性】
技术研发人员:李雨龙
申请(专利权)人:贝壳技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1