一种物体识别方法和装置制造方法及图纸

技术编号：35152256 阅读：18 留言：0更新日期：2022-10-05 10:31

本发明专利技术提供一种物体识别方法和装置，所述物体识别方法包括：获取待识别图像；利用预设的图像分割方法对所述待识别图像进行处理，得到第一预测结果；基于所述第一预测结果，通过对预设优化模型的目标函数求最优解来获得第二预测结果，其中，所述预设优化模型的目标函数以最大化所述目标物体识别框的多个角点、所述目标物体所处的场景类别以及所述目标物体语义的概率热力之和为目标；以及基于所述第二预测结果获得目标物体识别信息。本发明专利技术的方法和装置利用预设的优化模型对识别结果进行优化，解决了通用物体检测不兼容、通用物体检测识别准召率低的问题，并且能够利用该识别结果作为分析数据以支持设计、召回等进一步应用。作为分析数据以支持设计、召回等进一步应用。作为分析数据以支持设计、召回等进一步应用。

全部详细技术资料下载

【技术实现步骤摘要】
一种物体识别方法和装置

[0001]本专利技术涉及计算机领域，具体涉及一种物体识别方法和装置。

技术介绍

[0002]目前，利用人工智能识别图像中的物体的技术已经在各个领域进行了尝试和应用，其大多都是通过得到识别框来达到识别物体的目的。
[0003]在各种领域中，除了获得物体的识别框，能够获得物体更多的高级语义的需求越来越迫切。例如，在房产领域中，除了识别户型图中所显示的户型布局，如果还能够精确识别其中的家具、布局关系和更多高级语义，就能更全面地掌握房屋的内部情况，也能利用该识别结果作为分析数据以支持更深入的家装、设计、召回等应用。
[0004]因此，需要一种能够提供更多高级语义的物体识别方法和装置，从而克服上述问题。
[0005]需要说明的是，以上
技术介绍
部分所公开的信息仅用于增强对本专利技术背景的理解，因此其可能包含不构成对本领域技术人员已知的现有技术的信息。

技术实现思路

[0006]为了解决现有技术中存在的问题，本专利技术提供一种物体识别方法和装置，其通过设计了优化模型来对识别出的物体进行进一步筛选，不仅能够得到物体的位置和语义，还能得到物体所处的场景、布局关系和尺寸等高级语义信息。
[0007]本专利技术提供一种物体识别方法，包括：获取待识别图像；利用预设的图像分割方法对所述待识别图像进行处理，得到第一预测结果，所述第一预测结果包括目标物体识别框及所述目标物体识别框的多个角点、目标物体语义和场景类别；基于所述第一预测结果，通过对预设优化模型的目标函数求最优解来...

【技术保护点】

【技术特征摘要】
1.一种物体识别方法，其特征在于，包括：获取待识别图像；利用预设的图像分割方法对所述待识别图像进行处理，得到第一预测结果，所述第一预测结果包括目标物体识别框及所述目标物体识别框的多个角点、目标物体语义和场景类别；基于所述第一预测结果，通过对预设优化模型的目标函数求最优解来获得第二预测结果，其中，所述预设优化模型的目标函数以最大化所述目标物体识别框的多个角点、所述目标物体所处的场景类别以及所述目标物体语义的概率热力之和为目标；以及基于所述第二预测结果获得目标物体识别信息。2.据权利要求1所述的方法，其特征在于，所述预设优化模型为整数规划模型，其目标函数通过下式表示：其中，表示目标物体识别框的多个角点的概率热力；表示目标物体所处的场景类别以及目标物体语义的概率热力之和；式中，P(j)代表包含角点j的目标物体识别框；W
P
代表全局超参数；代表P(j)的权值；S(s,i)代表包含场景类别和目标物体语义的场景；W
Icon
代表目标物体语义的全局超参数；代表目标物体语义的概率热力；W
Scene
代表场景类别的全局超参数；代表目标物体所处的场景类别的概率热力。3.据权利要求2所述的方法，其特征在于，所述预设优化模型的约束条件包括以下中的一项或多项：近邻约束：(P(i)+P(k))≤1，其表示两个不同的目标物体识别框P(i)和P(k)之间的重叠率不能大于第一预设阈值；独热约束：其表示目标物体识别框P(p)只能取一种目标物体语义I
p
(i)，其中Set
icon
表示预设目标物体语义；互斥约束：(I(m)+I(k))≤1，其表示重叠率大于所述第一预设阈值...

【专利技术属性】
技术研发人员：李雨龙，
申请(专利权)人：贝壳技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人