评估目标检测模型的方法和系统技术方案

技术编号:31621581 阅读:12 留言:0更新日期:2021-12-29 18:57
本发明专利技术提供一种评估目标检测模型的方法和系统。该方法包括:基于目标检测模型,生成表示目标的预测边界框。该目标位于一个或多个相邻目标附近。该方法还包括确定该预测边界框和该目标的真值边界框之间的交集面积,以及确定该预测边界框和该目标的真值边界框之间的修正并集面积。确定修正并集面积包括:基于一个或多个权重,确定预测边界框和真值边界框之间的加权并集面积,将该预测边界框与所述一个或多个相邻目标的至少一个真值边界框之间的交集面积与加权并集面积相加。该方法进一步包括确定等于所述预测边界框和该目标的真值边界框之间的交集面积除以修正并集面积的分数。该分数代表该目标检测模型的性能。分数代表该目标检测模型的性能。分数代表该目标检测模型的性能。

【技术实现步骤摘要】
评估目标检测模型的方法和系统


[0001]本专利技术通常涉及用于评估目标检测模型的方法和系统,并且涉及目标检测方法和装置。

技术介绍

[0002]光学字符识别(Optical Character Recognition,OCR)将打印、手写或印刷的文本图像机械地或电子地转换为机器编码文本,无论该文本图像是来自扫描文档、文档照片、场景照片或叠加在图像上的字幕文本等等。为了识别文本,第一步要检测各文本段的边界框。用于检测文本的算法属于计算机视觉中的“目标检测”的领域。
[0003]在目标检测中,交并比(Intersection over Union,IoU)是用于评估检测器和模型选择的准确性的通用标准度量。传统的IoU公式定义为“预测边界框与真值(groundtruth)边界框之间的交集面积除以预测边界框与真值边界框之间的并集面积”。在大多数情况下,此公式都适用。但是,在文本检测的情况下,传统的IoU可能无法选择最佳的模型/参数,因此使用传统的IoU可能会大大降低文本识别的最终准确性。
[0004]例如,传统的IoU公式没有考虑至少两种情况,即,(1)传统的IoU没有考虑到交集(intersection)较小以及并集(union)较大均会类似地导致IoU较小,但是,对于文本检测而言,交集较小比并集较大更糟糕,因为这可能会导致文本的某些区域丢失并影响随后的OCR结果;(2)传统的IoU不考虑预测文本框与其他真值文本框之间的交集。如果缺乏对以上两种情况的考虑,即使IoU值更高,模型却不一定更好。
[0005]因此,需要提供可以改善用于文本检测的目标检测模型的评估的方法和设备。

技术实现思路

[0006]本公开的第一方面提供了一种用于评估目标检测模型的性能的方法。该方法包括基于所述目标检测模型,生成表示目标的预测边界框,其中,所述目标位于一个或多个相邻目标附近;确定所述预测边界框和所述目标的真值边界框之间的交集面积;确定所述预测边界框和所述目标的真值边界框之间的修正并集面积。确定所述修正并集面积包括根据一个或多个权重,确定所述预测边界框和所述真值边界框之间的加权并集面积;以及将所述预测边界框与所述一个或多个相邻目标的至少一个真值边界框之间的交集面积加上所述加权并集面积。该方法还包括确定分数,该分数等于所述预测边界框和所述目标的真值边界框之间的交集面积除以所述修正并集面积。该分数代表目标检测模型的性能。
[0007]本公开的第二方面提供一种目标检测方法。该方法包括:接收未标记的实际数据和多个目标检测模型,其中,所述多个目标检测模型由神经网络基于标记的训练数据生成;使用第一方面所述的方法,利用验证数据评估每个所述目标检测模型,以识别具有最高分数的所述目标检测模型;以及根据识别出的所述目标检测模型,在所述未标记的实际数据中检测目标。
[0008]本公开的第三方面提供一种用于评估目标检测模型的系统。该系统包括处理器以
及耦合到所述处理器并且存储有指令的计算机可读存储器。所述指令可由处理器执行以基于所述目标检测模型,生成表示目标的预测边界框,其中,所述目标位于一个或多个相邻目标附近;确定所述预测边界框和所述目标的真值边界框之间的交集面积;并确定所述预测边界框和所述目标的所述真值边界框之间的修正并集面积。所述并集修正面积是以下的总和:所述预测边界框和所述真值边界框之间的基于一个或多个权重的加权并集面积;以及所述预测边界框与所述一个或多个相邻目标的至少一个真值边界框之间的交集面积。指令还可以由所述处理器执行以确定等于所述预测边界框和所述目标的真值边界框之间的交集面积除以所述修正并集面积的分数。该分数代表目标检测模型的性能。
[0009]本公开的第四方面提供一种装置,包括:目标检测模块,其被配置为基于目标检测模型生成表示目标的预测边界框,其中,所述目标位于一个或多个相邻目标附近;以及评估模块。评估模块被配置为确定所述预测边界框和所述目标的真值边界框之间的交集面积;并确定所述预测边界框和所述目标的所述真值边界框之间的修正并集面积。所述修正并集面积是以下的总和:所述预测边界框和所述真值边界框之间的基于一个或多个权重的加权并集面积;以及所述预测边界框与所述一个或多个相邻目标的至少一个真值边界框之间的交集面积。评估模块还被配置为确定分数,该分数等于所述预测边界框和所述目标的真值边界框之间的交集面积除以所述修正并集面积;并基于所述分数,评估所述目标检测模型的性能。
[0010]本公开的第五方面提供了一种目标检测器。目标检测器包括接收器模块,其被配置为接收未标记的实际数据和多个目标检测模型。所述多个目标检测模型由神经网络基于标记的训练数据生成。目标检测器还包括如第四方面中限定的装置,该装置被耦合到所述接收器模块,并且被配置为利用验证数据评估每个所述目标检测模型,以识别具有最高分数的所述目标检测模型。目标检测模块还被配置为根据识别出的所述目标检测模型,在所述未标记的实际数据中检测目标。
附图说明
[0011]通过以下仅作为示例的文字描述,并结合附图,本领域的普通技术人员将更好地理解、更加清楚本专利技术的实施例,其中:
[0012]图1为根据一实施例示出的用于评估目标检测模型的方法的流程图。
[0013]图2a和图2b示出了在图1的方法中确定修正并集面积的实施方式的示意图。
[0014]图3为根据一实施例示出的目标检测方法的流程图。
[0015]图4为根据一实施例示出的目标检测器的示意图。
[0016]图5示出了适合于实现图1和图3的方法以及图4的目标检测器的计算机系统的示意图。
[0017]技术人员将理解,图中的要素是为了简单和清楚而示出的,并不一定按比例绘制。例如,相对于其他要素,可以放大插图、框图或流程图中的一些要素的尺寸,以帮助提高对本实施例的理解。
具体实施方式
[0018]本公开提供了基于改进的IoU公式来评估目标检测模型的方法和设备,该改进的
Integrated Circuit,ASIC)或现场可编程门阵列(Field Programmable Gate Array,FPGA)。还有许多其他的可能性存在。本领域技术人员将理解,该系统还可以被实现为硬件和软件模块的组合。
[0026]根据各种实施例,“电路”可以理解为任何种类的逻辑实现实体,其可以是专用电路或执行存储在存储器、固件(firmware)或其任何组合中的软件的处理器。因此,在一个实施例中,“电路”可以是硬线逻辑电路或可编程逻辑电路,如可编程处理器,例如微处理器(如,复杂指令集计算机(Complex Instruction Set Computer,CISC)处理器或精简指令集计算机(Reduced Instruction Set Computer,RISC)处理器)。“电路”也可以是处理器,其执行的软件,例如任何种类的计算机程序,例如使用诸如Java的虚拟机代码的计算机程序。根据替代实施例,可以在本文中更详细描述的各个功能的任何其他种类的实施方式也可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于评估目标检测模型的性能的方法,其特征在于,所述方法包括:利用所述目标检测模型检测目标对象的预测边界框;确定用于评估所述目标检测模型性能的分数,其中,所述分数与第一交集面积正相关,且与加权并集面积负相关;和/或所述分数与所述第一交集面积正相关,且与第二交集面积负相关;所述第一交集面积为所述目标对象的预测边界框与真实边界框的交集面积;所述加权并集面积为所述目标对象的预测边界框与真实边界框的加权并集面积;所述第二交集面积为所述目标对象的预测边界框与至少一个相邻对象的真实边界框的交集面积。2.根据权利要求1所述的方法,其特征在于,当所述分数与第一交集面积正相关,且与加权并集面积以及第二交集面积负相关时,所述分数的获取步骤包括:根据所述第二交集面积与所述加权并集面积之和确定修正并集面积;根据所述第一交集面积与所述修正并集面积之比确定所述分数。3.根据权利要求1所述的方法,其特征在于,所述加权并集面积为所述目标对象的预测边界框和真实边界框的多个非交集面积以及所述第一交集面积的加权和;其中,所述多个非交集面积分配有不同的权重。4.根据权利要求3所述的方法,其特征在于,所述多个非交集面积包括:所述目标对象的预测边界框中和真实边界框不相交的部...

【专利技术属性】
技术研发人员:黄江波
申请(专利权)人:创新先进技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1