【技术实现步骤摘要】
文本检测算法的性能测试方法、装置、设备及存储介质
本申请涉及文本识别
,尤其涉及一种文本检测算法的性能测试方法、装置、设备及存储介质。
技术介绍
OCR(OpticalCharacterRecognition,光学字符识别)是通过扫描等光学输入方式将各种证件、票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术,在一套完整的OCR算法实施流程中通常包含多个步骤,典型的步骤包括:图像预处理、文本检测以及文字识别等,其中影响识别准确率的步骤为文本检测和文字识别,文本检测是检测文本的所在位置、范围及其布局,包括版面分析和文字行检测等,然后对检测到的包含文字的文本框图片进行文字识别,由此可以看出文本检测的准确率影响着整个OCR算法实施流程的识别准确率,所以针对文本检测算法的性能测试显得尤为重要。
技术实现思路
本申请所要解决的技术问题在于,提供一种文本检测算法的性能测试方法、装置、设备及存储介质,能够在不改动文本识别模型源代码的情况下,对文本识别模型中的文本检测算法的性能进行测试,基于性能测试结果调整文本检测算法,从而可以提高单层文本检测算法的准确率,同时也提高了整个文本识别模型的准确率。为了解决上述技术问题,一方面,本申请提供了一种文本检测算法的性能测试方法,所述方法包括:将目标代码注入到文本识别模型中;所述文本识别模型包括用于基于待测试文本检测算法进行文本检测的文本检测层;所述目标代码包括用于提取所述文本检测层输出信息 ...
【技术保护点】
1.一种文本检测算法的性能测试方法,其特征在于,包括:/n将目标代码注入到文本识别模型中;所述文本识别模型包括用于基于待测试文本检测算法进行文本检测的文本检测层;所述目标代码包括用于提取所述文本检测层输出信息的代码;/n获取目标对象样本,对所述目标对象样本中的各目标对象进行文本信息标注,得到与各目标对象对应的文本标注信息;/n将各目标对象依次输入到已注入所述目标代码的文本识别模型中,基于所述目标代码提取与各目标对象对应的文本检测信息;/n基于各目标对象的文本检测信息以及各目标对象的文本标注信息,生成对所述待测试文本检测算法的性能测试结果。/n
【技术特征摘要】
1.一种文本检测算法的性能测试方法,其特征在于,包括:
将目标代码注入到文本识别模型中;所述文本识别模型包括用于基于待测试文本检测算法进行文本检测的文本检测层;所述目标代码包括用于提取所述文本检测层输出信息的代码;
获取目标对象样本,对所述目标对象样本中的各目标对象进行文本信息标注,得到与各目标对象对应的文本标注信息;
将各目标对象依次输入到已注入所述目标代码的文本识别模型中,基于所述目标代码提取与各目标对象对应的文本检测信息;
基于各目标对象的文本检测信息以及各目标对象的文本标注信息,生成对所述待测试文本检测算法的性能测试结果。
2.根据权利要求1所述的一种文本检测算法的性能测试方法,其特征在于,所述获取目标对象样本,对所述目标对象样本中的各目标对象进行文本信息标注,得到与各目标对象对应的文本标注信息包括:
确定每个目标对象包含的文本区域,对每个所述文本区域进行标注得到相应的文本框;
确定所述目标对象中各文本框的源位置信息;
将与所述目标对象对应的各文本框的源位置信息作为所述目标对象的文本标注信息。
3.根据权利要求1所述的一种文本检测算法的性能测试方法,其特征在于,所述将各目标对象依次输入到已注入所述目标代码的文本识别模型中,基于所述目标代码提取与各目标对象对应的文本检测信息包括:
对已注入所述目标代码的文本识别模型进行编译,生成可执行模型;
将各目标对象依次作为所述可执行模型的输入,运行所述可执行模型;
基于所述可执行模型中的目标代码,在所述文本检测层的输出端提取与各目标对象对应的文本检测信息。
4.根据权利要求2所述的一种文本检测算法的性能测试方法,其特征在于,所述文本识别模型还包括对象处理层;所述文本检测信息为基于所述待测试文本检测算法得到的文本框的检测位置信息,所述文本框的检测位置信息为检测到的文本框在经过所述对象预处理层之后的已处理对象中的位置信息;
相应地,所述基于各目标对象的文本检测信息以及各目标对象的文本标注信息,生成对所述待测试文本检测算法的性能测试结果包括:
对于经过所述对象预处理层处理之后的每个已处理对象,基于所述已处理对象中各文本框的检测位置信息进行位置信息还原,得到所述已处理对象中各文本框的还原位置信息;
确定所述已处理对象对应的目标对象,获取所述目标对象中各文本框的源位置信息;
基于预设方法、所述已处理对象中各文本框的还原位置信息以及所述目标对象中各文本框的源位置信息进行计算,得到所述待测试文本检测算法的性能测试结果。
5.根据权利要求4所述的一种文本检测算法的性能测试方法,其特征在于,所述对于经过所述对象预处理层处理之后的每个已处理对象,基于所述已处理对象中各文本框的检测位置信息进行位置信息还原,得到所述已处理对象中各文本框的还原位置信息包括:
基于所述对象预处理层中的对象预处理方法,确定逆向对象预处理方...
【专利技术属性】
技术研发人员:彭梅英,陈金龙,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。