文本检测算法的性能测试方法、装置、设备及存储介质制造方法及图纸

技术编号:24208525 阅读:16 留言:0更新日期:2020-05-20 15:45
本申请涉及一种文本检测算法的性能测试方法、装置、设备及存储介质,所述方法包括:将目标代码注入到文本识别模型中;获取目标对象样本,对所述目标对象样本中的各目标对象进行文本信息标注生成文本标注信息;将所述目标对象样本中的各目标对象依次输入到已注入所述目标代码的文本识别模型中,提取与各目标对象对应的文本检测信息;基于各目标对象的文本检测信息以及各目标对象的文本标注信息,生成对所述待测试文本检测算法的性能测试结果。本申请能够实现对文本识别模型中的文本检测算法的性能进行测试,基于性能测试结果调整文本检测算法,从而可以提高单层文本检测算法的准确率。

Performance test method, device, equipment and storage medium of text detection algorithm

【技术实现步骤摘要】
文本检测算法的性能测试方法、装置、设备及存储介质
本申请涉及文本识别
,尤其涉及一种文本检测算法的性能测试方法、装置、设备及存储介质。
技术介绍
OCR(OpticalCharacterRecognition,光学字符识别)是通过扫描等光学输入方式将各种证件、票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术,在一套完整的OCR算法实施流程中通常包含多个步骤,典型的步骤包括:图像预处理、文本检测以及文字识别等,其中影响识别准确率的步骤为文本检测和文字识别,文本检测是检测文本的所在位置、范围及其布局,包括版面分析和文字行检测等,然后对检测到的包含文字的文本框图片进行文字识别,由此可以看出文本检测的准确率影响着整个OCR算法实施流程的识别准确率,所以针对文本检测算法的性能测试显得尤为重要。
技术实现思路
本申请所要解决的技术问题在于,提供一种文本检测算法的性能测试方法、装置、设备及存储介质,能够在不改动文本识别模型源代码的情况下,对文本识别模型中的文本检测算法的性能进行测试,基于性能测试结果调整文本检测算法,从而可以提高单层文本检测算法的准确率,同时也提高了整个文本识别模型的准确率。为了解决上述技术问题,一方面,本申请提供了一种文本检测算法的性能测试方法,所述方法包括:将目标代码注入到文本识别模型中;所述文本识别模型包括用于基于待测试文本检测算法进行文本检测的文本检测层;所述目标代码包括用于提取所述文本检测层输出信息的代码;获取目标对象样本,对所述目标对象样本中的各目标对象进行文本信息标注,得到与各目标对象对应的文本标注信息;将各目标对象依次输入到已注入所述目标代码的文本识别模型中,基于所述目标代码提取与各目标对象对应的文本检测信息;基于各目标对象的文本检测信息以及各目标对象的文本标注信息,生成对所述待测试文本检测算法的性能测试结果。另一方面,本申请提供了一种文本检测算法的性能测试装置,所述装置包括:目标代码注入模块,用于将目标代码注入到文本识别模型中,所述目标代码包括用于提取所述文本检测层输出信息的代码;目标对象样本获取模块,用于获取目标对象样本,对所述目标对象样本中的各目标对象进行文本信息标注,得到与各目标对象对应的文本标注信息;文本检测信息提取模块,用于将各目标对象依次输入到已注入所述目标代码的文本识别模型中,基于所述目标代码提取与各目标对象对应的文本检测信息;测试结果生成模块,用于基于各目标对象的文本检测信息以及各目标对象的文本标注信息,生成对所述待测试文本检测算法的性能测试结果。另一方面,本申请提供了一种设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行如上述的文本检测算法的性能测试方法。另一方面,本申请提供了一种计算机存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行如上述的文本检测算法的性能测试方法。实施本申请实施例,具有如下有益效果:本申请通过将目标代码注入到文本识别模型中,所述目标代码包括用于提取所述文本检测层输出信息的代码;对所述目标对象样本中的各目标对象进行文本信息标注,得到目标对象文本标注信息;将各目标对象依次输入到已注入所述目标代码的文本识别模型中,基于所述目标代码提取与各目标对象对应的文本检测信息;基于各目标对象的文本检测信息和文本标注信息,生成对待测试文本检测算法的性能测试结果。本申请能够在不改动文本识别模型源代码的情况下,对文本识别模型中的文本检测算法的性能进行测试,基于性能测试结果调整文本检测算法,从而可以提高单层文本检测算法的准确率,同时也提高了整个文本识别模型的准确率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。图1是本申请实施例提供的实施环境示意图;图2是本申请实施例提供的一种文本检测算法的性能测试方法流程图;图3是本申请实施例提供的一种目标对象的文本标注方法流程图;图4是本申请实施例提供的一种文本检测信息提取方法流程图;图5是本申请实施例提供的一种文本检测算法的性能测试结果生成方法流程图;图6是本申请实施例提供的一种位置信息还原方法流程图;图7是本申请实施例提供的一种性能测试结果计算方法流程图;图8是本申请实施例提供的另一种文本检测算法的性能测试结果生成方法流程图;图9是本申请实施例提供的示例流程示意图;图10是本申请实施例提供的中间结果图片文件格式示意图;图11是本申请实施例提供的一种文本检测算法的性能测试装置示意图;图12是本申请实施例提供的一种设备结构示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。首先对本申请实施例中涉及的相关术语做以下解释:AOP:面向切面编程,对业务处理过程中的切面进行提取,动态地将代码切入到指定的方法、位置上。文本检测:在OCR领域中,文本检测是场景文本识别的前提条件,要解决的问题是如何在杂乱无序、千奇百怪的复杂场景中准确地定位出文字所匹配的文本框的位置。交并比(Intersectionoverunion,IOU):是模型所预测的检测框和真实的检测框的交集和并集之间的比例,预测框和真实框重叠的区域就是交集区域,预测框和真实框的总面积区域就是并集框,使用IOU看检测是否正确需要设定一个阈值,最常用的阈值是0.5(可根据实际情况自定义阀值),即如果IOU>0.5,则认为是真实的检测(truedetection),否则认为是错误的检测(falsedetection)。OpenCV:是一个跨平台计算机视觉库本文档来自技高网...

【技术保护点】
1.一种文本检测算法的性能测试方法,其特征在于,包括:/n将目标代码注入到文本识别模型中;所述文本识别模型包括用于基于待测试文本检测算法进行文本检测的文本检测层;所述目标代码包括用于提取所述文本检测层输出信息的代码;/n获取目标对象样本,对所述目标对象样本中的各目标对象进行文本信息标注,得到与各目标对象对应的文本标注信息;/n将各目标对象依次输入到已注入所述目标代码的文本识别模型中,基于所述目标代码提取与各目标对象对应的文本检测信息;/n基于各目标对象的文本检测信息以及各目标对象的文本标注信息,生成对所述待测试文本检测算法的性能测试结果。/n

【技术特征摘要】
1.一种文本检测算法的性能测试方法,其特征在于,包括:
将目标代码注入到文本识别模型中;所述文本识别模型包括用于基于待测试文本检测算法进行文本检测的文本检测层;所述目标代码包括用于提取所述文本检测层输出信息的代码;
获取目标对象样本,对所述目标对象样本中的各目标对象进行文本信息标注,得到与各目标对象对应的文本标注信息;
将各目标对象依次输入到已注入所述目标代码的文本识别模型中,基于所述目标代码提取与各目标对象对应的文本检测信息;
基于各目标对象的文本检测信息以及各目标对象的文本标注信息,生成对所述待测试文本检测算法的性能测试结果。


2.根据权利要求1所述的一种文本检测算法的性能测试方法,其特征在于,所述获取目标对象样本,对所述目标对象样本中的各目标对象进行文本信息标注,得到与各目标对象对应的文本标注信息包括:
确定每个目标对象包含的文本区域,对每个所述文本区域进行标注得到相应的文本框;
确定所述目标对象中各文本框的源位置信息;
将与所述目标对象对应的各文本框的源位置信息作为所述目标对象的文本标注信息。


3.根据权利要求1所述的一种文本检测算法的性能测试方法,其特征在于,所述将各目标对象依次输入到已注入所述目标代码的文本识别模型中,基于所述目标代码提取与各目标对象对应的文本检测信息包括:
对已注入所述目标代码的文本识别模型进行编译,生成可执行模型;
将各目标对象依次作为所述可执行模型的输入,运行所述可执行模型;
基于所述可执行模型中的目标代码,在所述文本检测层的输出端提取与各目标对象对应的文本检测信息。


4.根据权利要求2所述的一种文本检测算法的性能测试方法,其特征在于,所述文本识别模型还包括对象处理层;所述文本检测信息为基于所述待测试文本检测算法得到的文本框的检测位置信息,所述文本框的检测位置信息为检测到的文本框在经过所述对象预处理层之后的已处理对象中的位置信息;
相应地,所述基于各目标对象的文本检测信息以及各目标对象的文本标注信息,生成对所述待测试文本检测算法的性能测试结果包括:
对于经过所述对象预处理层处理之后的每个已处理对象,基于所述已处理对象中各文本框的检测位置信息进行位置信息还原,得到所述已处理对象中各文本框的还原位置信息;
确定所述已处理对象对应的目标对象,获取所述目标对象中各文本框的源位置信息;
基于预设方法、所述已处理对象中各文本框的还原位置信息以及所述目标对象中各文本框的源位置信息进行计算,得到所述待测试文本检测算法的性能测试结果。


5.根据权利要求4所述的一种文本检测算法的性能测试方法,其特征在于,所述对于经过所述对象预处理层处理之后的每个已处理对象,基于所述已处理对象中各文本框的检测位置信息进行位置信息还原,得到所述已处理对象中各文本框的还原位置信息包括:
基于所述对象预处理层中的对象预处理方法,确定逆向对象预处理方...

【专利技术属性】
技术研发人员:彭梅英陈金龙
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1