目标框预测方法、装置、设备及介质制造方法及图纸

技术编号：27977246 阅读：28 留言：0更新日期：2021-04-06 14:11

本发明专利技术实施例提供了一种目标框预测方法、装置、设备及介质，所述方法包括：对图像中预设类别的多个目标进行检测，得到多个候选预测框；确定所述多个候选预测框分别与所述预设类别对应的各个标注框之间的重合度；从所述各个候选预测框中，确定与所述多个标注框匹配且使得重合度之和最大的多个匹配预测框；根据所述多个匹配预测框与所述多个标注框之间的匹配关系，确定所述预设类别的多个目标在所述图像中匹配的目标预测框。

全部详细技术资料下载

【技术实现步骤摘要】
目标框预测方法、装置、设备及介质
本专利技术涉及图像处理
，特别是涉及一种目标框预测方法、装置、设备及介质。
技术介绍
目前，基于深度学习的物体检测方法会利用卷积神经网络提取图像的深度特征，在用这些深度特征预测图像中各个目标所属类别的概率以及对应目标框的位置。在通过卷积神经网络进行目标框的预测时，其预测结果一般是与图像的标注框进行比较，从而根据比较结果区分出预测的准确度，例如，目标框的预测结果和标注框之间的交并比大于某个阈值，则认为预测结果是准确的，小于某个阈值则认为预测结果是错误的，从而可以评估卷积神经网络的性能。因此，如何确定预测结果与标注框之间的对应关系，对卷积神经网络模型的的图像识别准确度有较大的影响。实际中，卷积神经网络是同时对数量众多的目标框进行预测，一般，预测框的数目远大于标注框的数量。此种情况下，经常导致目标框的预测结果和标注框之间进行了不合理的对应，造成预测结果的正确与否的判定不够合理和准确，导致卷积神经网络模型的图像识别准确度较低，即预测结果的置信度较低。
技术实现思路
鉴于上述问题，提出了本专利技术实施例的一种目标框预测方法、装置、设备及介质，以便克服上述问题或者至少部分地解决上述问题。为了解决上述问题，本专利技术的第一方面，公开了一种目标框预测方法，所述方法包括：对图像中预设类别的多个目标进行检测，得到多个候选预测框；确定所述多个候选预测框分别与所述预设类别对应的各个标注框之间的重合度；从所述各个标注框中，确定与所述多个...

【技术保护点】
1.一种目标框预测方法，其特征在于，包括：/n对图像中预设类别的多个目标进行检测，得到多个候选预测框；/n确定所述多个候选预测框分别与所述预设类别对应的各个标注框之间的重合度；/n从所述各个候选预测框中，确定与所述多个标注框匹配且使得重合度之和最大的多个匹配预测框；/n根据所述多个匹配预测框与所述多个标注框之间的匹配关系，确定所述预设类别的多个目标在所述图像中匹配的目标预测框。/n

【技术特征摘要】
1.一种目标框预测方法，其特征在于，包括：
对图像中预设类别的多个目标进行检测，得到多个候选预测框；
确定所述多个候选预测框分别与所述预设类别对应的各个标注框之间的重合度；
从所述各个候选预测框中，确定与所述多个标注框匹配且使得重合度之和最大的多个匹配预测框；
根据所述多个匹配预测框与所述多个标注框之间的匹配关系，确定所述预设类别的多个目标在所述图像中匹配的目标预测框。

2.根据权利要求1所述的方法，其特征在于，从所述各个候选预测框中，确定与所述多个标注框匹配且使得重合度之和最大的多个匹配预测框，包括：
基于所述多个候选预测框以及所述各个标注框，构建第一EMD模型，其中，以每个候选预测框为一个节点，每个标注框为一个节点，构建每个候选预测框所在的节点到每个标注框所在的节点之间的边，所述第一EMD模型包括的各个边的流表征所连接的两个节点所表征的两个框之间匹配的概率，所述第一EMD模型包括的各个边的代价表征所连接的两个节点所表征的两个框之间的重合度；
对所述第一EMD模型求解，确定与所述多个标注框匹配且使得重合度之和最大的多个匹配预测框。

3.根据权利要求2所述的方法，其特征在于，对所述第一EMD模型求解，确定与所述多个标注框匹配且使得重合度之和最大的多个匹配预测框，包括：
求解以下线性规划方程，以确定与所述多个标注框匹配且使得重合度之和最大的多个匹配预测框：

其中，fij≥0i＝1，2，...，m，j＝1，2，...，n；
其中，所述线性规划方程的约束条件为：

其中：si＝pii＝1，2，...，m
dj＝1j＝1，2，...，n
cij＝1-GIoU(b1i，b2j)i＝1，2，...，m，j＝1，2，...，n
其中，m表示所述多个候选预测框的总数，n表示所述各个标注框的总数，fij和cij分别表示第i各个候选预测框所在的节点与第j个标注框所在的节点之间的边的流和代价，pi表示第i个候选预测框所框选的目标的类别预测概率中所述预设类别的预测概率，bi表示第i个候选预测框所框选的区域，b2j表示第j个标注框所框选的区域。

4.根据权利要求2所述的方法，其特征在于，在基于所述多个候选预测框以及所述各个标注框，构建第一EMD模型之后，所述方法还包括：
增加满足的第一虚拟节点和第二虚拟节点，构建所述第一虚拟节点到每个标注框所在的节点之间的第一虚拟边，并构建每个候选预测框所在的节点到所述第二虚拟节点之间的第二虚拟边，所述第一EMD模型包括的各个第一虚拟边的流表征所连接的节点所表征的标注框所框选的目标被漏识别的概率，所述第一EMD模型包括的各个第二虚拟边的流表征所连接的节点所表征的候选预测框是难例负样本的概率；
确定与所述多个标注框匹配且使得重合度之和最大的多个匹配预测框，包括：
求解以下线性规划方程，以确定与所述多个标注框匹配且使得重合度之和最大的多个匹配预测框：

其中，fij≥oi＝1，2，...，m，m+1，j＝1，2，...，n，n+1
其中，约束条件为：

其中，si＝pii＝1，2，...，m
dj＝1j＝1，2，...，n
当时，sm+1＝0
当时，dn+1＝0
cij＝1-GloU(b1i，b2...

【专利技术属性】
技术研发人员：王英明，杨同，
申请(专利权)人：北京迈格威科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人