文本识别方法及文本识别模型确定方法技术

技术编号：37081538 阅读：21 留言：0更新日期：2023-03-29 19:57

本说明书实施例提供文本识别方法及文本识别模型确定方法，其中，该文本识别方法先将目标文本图像通过文本检测模型获得仅包含文本信息的文本检测图像，以使得将该文本检测图像通过第一文本识别模型(如简体中文识别模型)进行文本识别时，不会受到目标文本图像中其他非文本区域的噪声干扰，快速准确的输出初始文本识别结果；并且在该初始文本识别结果中包含第二类型(如繁体)的初始文本的情况下，通过该第二类型的初始文本在初始文本识别结果中的占比，对初始文本识别结果进行再次核验，以进一步保证目标文本识别结果的准确率，使得该文本识别方法应用于智能化测试场景中，可以极大的提升智能化测试的通过率，减少测试人员的测试工作量。的测试工作量。的测试工作量。

全部详细技术资料下载

【技术实现步骤摘要】
文本识别方法及文本识别模型确定方法

[0001]本说明书实施例涉及计算机
，特别涉及文本识别方法及文本识别模型确定方法。

技术介绍

[0002]为最大幅度减轻手动测试的比例，实现自动化和智能化测试，app(application，应用程序)自动化工具的应用日趋广泛。在自动化测试中，需要软件来模拟人工进行移动端功能测试，比如点击/滑动等。常规的操作如滑动，点击屏幕都比较容易模拟，但是当涉及到具体目标的点击时，对于特定目标的定位就比较关键。比如要实现对某个按钮的点击，可通过该按钮的文本OCR(optical character recognition，光学字符识别)信息进行按钮位置的捕捉，这就需要对该按钮的文本进行识别时具有较高准确率，以避免导致智能化测试影响测试人员的测试进度，增加测试人员的测试工作量。

技术实现思路

[0003]有鉴于此，本说明书实施例提供了一种文本识别方法。本说明书一个或者多个实施例同时涉及一种文本识别装置，一种文本识别模型确定方法及装置，一种计算设备，一种计算机可读存储介质以及一种计算机程序，以解决现有技术中存在的技术缺陷。
[0004]根据本说明书实施例的第一方面，提供了一种文本识别方法，包括：
[0005]将目标文本图像输入文本检测模型，获得文本检测图像；
[0006]将所述文本检测图像输入第一文本识别模型，获得初始文本识别结果；
[0007]在确定所述初始文本识别结果中包括第二类型的初始文本的情况下，根据所述第二类型的初始文本在所述初始文...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法，包括：将目标文本图像输入文本检测模型，获得文本检测图像；将所述文本检测图像输入第一文本识别模型，获得初始文本识别结果；在确定所述初始文本识别结果中包括第二类型的初始文本的情况下，根据所述第二类型的初始文本在所述初始文本识别结果中的文本占比，确定目标文本识别结果。2.根据权利要求1所述的文本识别方法，所述根据所述第二类型的初始文本在所述初始文本识别结果中的文本占比，确定目标文本识别结果，包括：将所述第二类型的初始文本转换为第一类型的初始文本；在根据所述第二类型的初始文本以及转换后的第一类型的初始文本，确定存在目标文本的情况下，确定所述目标文本在所述初始文本识别结果中的文本占比；在所述文本占比大于第一预设阈值的情况下，将所述文本检测图像输入第二文本识别模型，获得候选文本识别结果；根据所述初始文本识别结果以及所述候选文本识别结果，确定目标文本识别结果。3.根据权利要求2所述的文本识别方法，所述文本检测图像中包括文本坐标，所述初始文本识别结果中包括初始文本以及所述初始文本的置信度，所述候选文本识别结果中包括候选文本以及所述候选文本的置信度；相应地，所述根据所述初始文本识别结果以及所述候选文本识别结果，确定目标文本识别结果，包括：根据所述文本坐标，将所述初始文本以及所述候选文本进行对齐，获得对齐文本；根据所述初始文本的置信度以及所述候选文本的置信度，从所述对齐文本中确定目标文本识别结果。4.根据权利要求2或3所述的文本识别方法，所述在根据所述第二类型的初始文本以及转换后的第一类型的初始文本，确定存在目标文本的情况下，确定所述目标文本在所述初始文本识别结果中的文本占比，包括：将所述第二类型的初始文本与转换后的第一类型的初始文本进行字形匹配；在确定存在字形不匹配的初始文本的情况下，将所述字形不匹配的初始文本确定为目标文本，并确定所述目标文本在所述初始文本识别结果中的文本占比。5.根据权利要求2或3所述的文本识别方法，所述将第二类型的初始文本转换为第一类型的初始文本之后，还包括：在根据所述第二类型的文本以及转换后的第一类型的文本，确定不存在目标文本的情况下，将所述初始文本识别结果确定为目标文本识别结果。6.根据权利要求5所述的文本识别方法，所述在根据所述第二类型的文本以及转换后的第一类型的文本，确定不存在目标文本的情况下，将所述初始文本识别结果确定为目标文本识别结果，包括：将所述第二类型的初始文本与转换后的第一类型的初始文本进行字形匹配；在确定不存在字形不匹配的初始文本的情况下，将所述初始文本识别结果确定为目标文本识别结果。7.根据权利要求2所述的文本识别方法，所述确定所述目标文本在所述初始文本识别结果中的文本占比之后，还包括：
在所述文本占比小于等于所述第一预设阈值的情况下，将所述初始文本识别结果确定为目标文本识别结果。8.根据权利要求1所述的文本识别方法，所述将目标文本图像输入文本检测模型，获得文本检测图像，包括：将所述目标文本图像输入文本检测模型，在所述文本检测模型中通过分割网络进行特征提取，获得所述目标文本图像对应的特征图像；根据所述目标文本图像对应的特征图像进行预测，获得所述目标文本图像中像素点分类结果的概率图、以及文本边框的阈值图；根据可微分的二值化算法融合所述概率图以及所述阈值图，确定所述目标文本图像的二值图，并根据所述二值图确定文本检...

【专利技术属性】
技术研发人员：刘家聪，任皓天，冯帅，龚树棻，
申请(专利权)人：支付宝实验室新加坡有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人