文本识别方法及文本识别模型确定方法技术

技术编号:37081538 阅读:21 留言:0更新日期:2023-03-29 19:57
本说明书实施例提供文本识别方法及文本识别模型确定方法,其中,该文本识别方法先将目标文本图像通过文本检测模型获得仅包含文本信息的文本检测图像,以使得将该文本检测图像通过第一文本识别模型(如简体中文识别模型)进行文本识别时,不会受到目标文本图像中其他非文本区域的噪声干扰,快速准确的输出初始文本识别结果;并且在该初始文本识别结果中包含第二类型(如繁体)的初始文本的情况下,通过该第二类型的初始文本在初始文本识别结果中的占比,对初始文本识别结果进行再次核验,以进一步保证目标文本识别结果的准确率,使得该文本识别方法应用于智能化测试场景中,可以极大的提升智能化测试的通过率,减少测试人员的测试工作量。的测试工作量。的测试工作量。

【技术实现步骤摘要】
文本识别方法及文本识别模型确定方法


[0001]本说明书实施例涉及计算机
,特别涉及文本识别方法及文本识别模型确定方法。

技术介绍

[0002]为最大幅度减轻手动测试的比例,实现自动化和智能化测试,app(application,应用程序)自动化工具的应用日趋广泛。在自动化测试中,需要软件来模拟人工进行移动端功能测试,比如点击/滑动等。常规的操作如滑动,点击屏幕都比较容易模拟,但是当涉及到具体目标的点击时,对于特定目标的定位就比较关键。比如要实现对某个按钮的点击,可通过该按钮的文本OCR(optical character recognition,光学字符识别)信息进行按钮位置的捕捉,这就需要对该按钮的文本进行识别时具有较高准确率,以避免导致智能化测试影响测试人员的测试进度,增加测试人员的测试工作量。

技术实现思路

[0003]有鉴于此,本说明书实施例提供了一种文本识别方法。本说明书一个或者多个实施例同时涉及一种文本识别装置,一种文本识别模型确定方法及装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
[0004]根据本说明书实施例的第一方面,提供了一种文本识别方法,包括:
[0005]将目标文本图像输入文本检测模型,获得文本检测图像;
[0006]将所述文本检测图像输入第一文本识别模型,获得初始文本识别结果;
[0007]在确定所述初始文本识别结果中包括第二类型的初始文本的情况下,根据所述第二类型的初始文本在所述初始文本识别结果中的文本占比,确定目标文本识别结果。
[0008]根据本说明书实施例的第二方面,提供了一种文本识别装置,包括:
[0009]图像检测模块,被配置为将目标文本图像输入文本检测模型,获得文本检测图像;
[0010]第一文本识别模块,被配置为将所述文本检测图像输入第一文本识别模型,获得初始文本识别结果;
[0011]第二文本识别模块,被配置为在确定所述初始文本识别结果中包括第二类型的初始文本的情况下,根据所述第二类型的初始文本在所述初始文本识别结果中的文本占比,确定目标文本识别结果。
[0012]根据本说明书实施例的第三方面,提供了一种文本识别模型确定方法,包括:
[0013]确定第一训练集,其中,所述第一训练集中包括第一类型文本图像样本以及所述第一类型文本图像样本对应的样本标签、满足预设条件的第二类型文本图像样本以及所述满足预设条件的第二类型文本图像样本对应的样本标签;
[0014]确定第二训练集,其中,所述第二训练集中包括第二类型文本图像样本以及所述第二类型文本图像样本对应的样本标签;
[0015]根据所述第一训练集,训练获得第一文本识别模型,以及根据所述第二训练集,训
练获得第二文本识别模型。
[0016]根据本说明书实施例的第四方面,提供了一种文本识别模型确定装置,包括:
[0017]第一确定模块,被配置为确定第一训练集,其中,所述第一训练集中包括第一类型文本图像样本以及所述第一类型文本图像样本对应的样本标签、满足预设条件的第二类型文本图像样本以及所述满足预设条件的第二类型文本图像样本对应的样本标签;
[0018]第二确定模块,被配置为确定第二训练集,其中,所述第二训练集中包括第二类型文本图像样本以及所述第二类型文本图像样本对应的样本标签;
[0019]模型训练模块,被配置为根据所述第一训练集,训练获得第一文本识别模型,以及根据所述第二训练集,训练获得第二文本识别模型。
[0020]根据本说明书实施例的第五方面,提供了一种计算设备,包括:
[0021]存储器和处理器;
[0022]所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述文本识别方法或者文本识别模型确定方法的步骤。
[0023]根据本说明书实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述文本识别方法或者文本识别模型确定方法的步骤。
[0024]根据本说明书实施例的第七方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述文本识别方法或者文本识别模型确定方法的步骤。
[0025]本说明书一个实施例提供了一种文本识别方法,包括将目标文本图像输入文本检测模型,获得文本检测图像;将所述文本检测图像输入第一文本识别模型,获得初始文本识别结果;在确定所述初始文本识别结果中包括第二类型的初始文本的情况下,根据所述第二类型的初始文本在所述初始文本识别结果中的文本占比,确定目标文本识别结果。
[0026]具体的,该文本识别方法先将目标文本图像通过文本检测模型获得仅包含文本信息的文本检测图像,以使得将该文本检测图像通过第一文本识别模型(如简体中文识别模型)进行文本识别时,不会受到目标文本图像中其他非文本区域的噪声干扰,快速准确的输出初始文本识别结果;并且在该初始文本识别结果中包含第二类型(如繁体)的初始文本的情况下,通过该第二类型的初始文本在初始文本识别结果中的占比,对初始文本识别结果进行再次核验,以进一步保证目标文本识别结果的准确率,使得该文本识别方法应用于智能化测试场景中,可以极大的提升智能化测试的通过率,减少测试人员的测试工作量。
附图说明
[0027]图1是本说明书一个实施例提供的一种文本识别模型确定方法的具体实现场景示意图;
[0028]图2是本说明书一个实施例提供的一种文本识别方法的流程图;
[0029]图3是本说明书一个实施例提供的一种文本识别方法中文本检测模型对目标文本图像的具体处理流程示意图;
[0030]图4是本说明书一个实施例提供的一种文本识别方法中第一文本识别模型对文本
检测图像的具体处理流程示意图;
[0031]图5是本说明书一个实施例提供的一种文本识别模型确定方法的流程图;
[0032]图6是本说明书一个实施例提供的一种文本识别模型确定方法的处理过程流程图;
[0033]图7是本说明书一个实施例提供的一种文本识别装置的结构示意图;
[0034]图8是本说明书一个实施例提供的一种文本识别模型确定装置的结构示意图;
[0035]图9是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
[0036]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0037]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法,包括:将目标文本图像输入文本检测模型,获得文本检测图像;将所述文本检测图像输入第一文本识别模型,获得初始文本识别结果;在确定所述初始文本识别结果中包括第二类型的初始文本的情况下,根据所述第二类型的初始文本在所述初始文本识别结果中的文本占比,确定目标文本识别结果。2.根据权利要求1所述的文本识别方法,所述根据所述第二类型的初始文本在所述初始文本识别结果中的文本占比,确定目标文本识别结果,包括:将所述第二类型的初始文本转换为第一类型的初始文本;在根据所述第二类型的初始文本以及转换后的第一类型的初始文本,确定存在目标文本的情况下,确定所述目标文本在所述初始文本识别结果中的文本占比;在所述文本占比大于第一预设阈值的情况下,将所述文本检测图像输入第二文本识别模型,获得候选文本识别结果;根据所述初始文本识别结果以及所述候选文本识别结果,确定目标文本识别结果。3.根据权利要求2所述的文本识别方法,所述文本检测图像中包括文本坐标,所述初始文本识别结果中包括初始文本以及所述初始文本的置信度,所述候选文本识别结果中包括候选文本以及所述候选文本的置信度;相应地,所述根据所述初始文本识别结果以及所述候选文本识别结果,确定目标文本识别结果,包括:根据所述文本坐标,将所述初始文本以及所述候选文本进行对齐,获得对齐文本;根据所述初始文本的置信度以及所述候选文本的置信度,从所述对齐文本中确定目标文本识别结果。4.根据权利要求2或3所述的文本识别方法,所述在根据所述第二类型的初始文本以及转换后的第一类型的初始文本,确定存在目标文本的情况下,确定所述目标文本在所述初始文本识别结果中的文本占比,包括:将所述第二类型的初始文本与转换后的第一类型的初始文本进行字形匹配;在确定存在字形不匹配的初始文本的情况下,将所述字形不匹配的初始文本确定为目标文本,并确定所述目标文本在所述初始文本识别结果中的文本占比。5.根据权利要求2或3所述的文本识别方法,所述将第二类型的初始文本转换为第一类型的初始文本之后,还包括:在根据所述第二类型的文本以及转换后的第一类型的文本,确定不存在目标文本的情况下,将所述初始文本识别结果确定为目标文本识别结果。6.根据权利要求5所述的文本识别方法,所述在根据所述第二类型的文本以及转换后的第一类型的文本,确定不存在目标文本的情况下,将所述初始文本识别结果确定为目标文本识别结果,包括:将所述第二类型的初始文本与转换后的第一类型的初始文本进行字形匹配;在确定不存在字形不匹配的初始文本的情况下,将所述初始文本识别结果确定为目标文本识别结果。7.根据权利要求2所述的文本识别方法,所述确定所述目标文本在所述初始文本识别结果中的文本占比之后,还包括:
在所述文本占比小于等于所述第一预设阈值的情况下,将所述初始文本识别结果确定为目标文本识别结果。8.根据权利要求1所述的文本识别方法,所述将目标文本图像输入文本检测模型,获得文本检测图像,包括:将所述目标文本图像输入文本检测模型,在所述文本检测模型中通过分割网络进行特征提取,获得所述目标文本图像对应的特征图像;根据所述目标文本图像对应的特征图像进行预测,获得所述目标文本图像中像素点分类结果的概率图、以及文本边框的阈值图;根据可微分的二值化算法融合所述概率图以及所述阈值图,确定所述目标文本图像的二值图,并根据所述二值图确定文本检...

【专利技术属性】
技术研发人员:刘家聪任皓天冯帅龚树棻
申请(专利权)人:支付宝实验室新加坡有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1