评估目标检测模型的方法和系统技术方案

技术编号：31621581 阅读：12 留言：0更新日期：2021-12-29 18:57

本发明专利技术提供一种评估目标检测模型的方法和系统。该方法包括：基于目标检测模型，生成表示目标的预测边界框。该目标位于一个或多个相邻目标附近。该方法还包括确定该预测边界框和该目标的真值边界框之间的交集面积，以及确定该预测边界框和该目标的真值边界框之间的修正并集面积。确定修正并集面积包括：基于一个或多个权重，确定预测边界框和真值边界框之间的加权并集面积，将该预测边界框与所述一个或多个相邻目标的至少一个真值边界框之间的交集面积与加权并集面积相加。该方法进一步包括确定等于所述预测边界框和该目标的真值边界框之间的交集面积除以修正并集面积的分数。该分数代表该目标检测模型的性能。分数代表该目标检测模型的性能。分数代表该目标检测模型的性能。

全部详细技术资料下载

【技术实现步骤摘要】
评估目标检测模型的方法和系统

[0001]本专利技术通常涉及用于评估目标检测模型的方法和系统，并且涉及目标检测方法和装置。

技术介绍

[0002]光学字符识别(Optical Character Recognition，OCR)将打印、手写或印刷的文本图像机械地或电子地转换为机器编码文本，无论该文本图像是来自扫描文档、文档照片、场景照片或叠加在图像上的字幕文本等等。为了识别文本，第一步要检测各文本段的边界框。用于检测文本的算法属于计算机视觉中的“目标检测”的领域。
[0003]在目标检测中，交并比(Intersection over Union，IoU)是用于评估检测器和模型选择的准确性的通用标准度量。传统的IoU公式定义为“预测边界框与真值(groundtruth)边界框之间的交集面积除以预测边界框与真值边界框之间的并集面积”。在大多数情况下，此公式都适用。但是，在文本检测的情况下，传统的IoU可能无法选择最佳的模型/参数，因此使用传统的IoU可能会大大降低文本识别的最终准确性。
[0004]例如，传统的IoU公式没有考虑至少两种情况，即，(1)传统的IoU没有考虑到交集(intersection)较小以及并集(union)较大均会类似地导致IoU较小，但是，对于文本检测而言，交集较小比并集较大更糟糕，因为这可能会导致文本的某些区域丢失并影响随后的OCR结果；(2)传统的IoU不考虑预测文本框与其他真值文本框之间的交集。如果缺乏对以上两种情况的考虑，即使IoU值更高，模型却不一定更好。
[0...

【技术保护点】

【技术特征摘要】
1.一种用于评估目标检测模型的性能的方法，其特征在于，所述方法包括：利用所述目标检测模型检测目标对象的预测边界框；确定用于评估所述目标检测模型性能的分数，其中，所述分数与第一交集面积正相关，且与加权并集面积负相关；和/或所述分数与所述第一交集面积正相关，且与第二交集面积负相关；所述第一交集面积为所述目标对象的预测边界框与真实边界框的交集面积；所述加权并集面积为所述目标对象的预测边界框与真实边界框的加权并集面积；所述第二交集面积为所述目标对象的预测边界框与至少一个相邻对象的真实边界框的交集面积。2.根据权利要求1所述的方法，其特征在于，当所述分数与第一交集面积正相关，且与加权并集面积以及第二交集面积负相关时，所述分数的获取步骤包括：根据所述第二交集面积与所述加权并集面积之和确定修正并集面积；根据所述第一交集面积与所述修正并集面积之比确定所述分数。3.根据权利要求1所述的方法，其特征在于，所述加权并集面积为所述目标对象的预测边界框和真实边界框的多个非交集面积以及所述第一交集面积的加权和；其中，所述多个非交集面积分配有不同的权重。4.根据权利要求3所述的方法，其特征在于，所述多个非交集面积包括：所述目标对象的预测边界框中和真实边界框不相交的部...

【专利技术属性】
技术研发人员：黄江波，
申请(专利权)人：创新先进技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人