文本识别方法技术

技术编号：38440658 阅读：11 留言：0更新日期：2023-08-11 14:23

本申请公开一种文本识别方法，包括：针对单字符图像，通过第一文本识别模型获得第一识别结果，通过第二文本识别模型获得第二识别结果；若第一识别结果与第二识别结果相同，则输出第一识别结果或第二识别结果；若第一识别结果与第二识别结果不相同，且第一识别结果为生僻字的情况下，则输出第一识别结果。本申请可以采用单字符识别方式，省去了实现难度较高的行检测及切分环节，从而解决了复杂拍摄环境和拍摄不规范带来的识别精度下降问题。另外，还可以利用第一文本识别模型的优势来准确识别生僻字，又可以利用第二文本识别模型来准确识别生僻字的形近字，从而解决了模型更新生僻字后导致对形近字的识别精度降低的问题。后导致对形近字的识别精度降低的问题。后导致对形近字的识别精度降低的问题。

全部详细技术资料下载

【技术实现步骤摘要】
文本识别方法

[0001]本申请涉及文本处理
，特别涉及一种文本识别方法、计算机可读存储介质、电子设备及计算机程序产品。

技术介绍

[0002]文本识别是文本处理领域的重要技术手段，文本识别能够使得计算机对包含有字符内容的图像中的字符进行识别，文本识别后计算机即可对识别到的字符进行处理，提升了文本自动化处理的效率。
[0003]目前，可以采用行识别的方式实现文本识别，具体的，行识别方式首先可以检测出图像中单行文字所在的区域，之后将单行文字所在的区域切割提取，再采用行文字识别算法，对单行文字所在的区域中的字符进行识别。
[0004]但是，目前方案中，由于待识别图像经常是在复杂拍摄环境下拍摄得到的，则对待识别图像进行行识别的难度较高，进而降低了文本识别精度，另外，文本识别的模型在更新了生僻字后，反而会导致对这些生僻字的形近字的识别精度降低。

技术实现思路

[0005]本申请实施例提供一种文本识别方法、计算机可读存储介质、电子设备及计算机程序产品，以实现采用单字符识别方式提升文本识别精度的目的。
[0006]根据本申请的第一方面，公开了一种文本识别方法，包括：
[0007]获取包含字符内容的字符图像；
[0008]从所述字符图像中切分获得单字符图像；每个所述单字符图像包含一个字符；
[0009]将所述单字符图像输入第一文本识别模型，获得所述第一文本识别模型输出的每个单字符图像的第一识别结果，以及将所述单字符图像输入第二文本识别模型，获得所述第二文本识别模

【技术保护点】

【技术特征摘要】
1.一种文本识别方法，其特征在于，包括：获取包含字符内容的字符图像；从所述字符图像中切分获得单字符图像；每个所述单字符图像包含一个字符；将所述单字符图像输入第一文本识别模型，获得所述第一文本识别模型输出的每个单字符图像的第一识别结果，以及将所述单字符图像输入第二文本识别模型，获得所述第二文本识别模型输出的每个单字符图像的第二识别结果；所述第一文本识别模型为用于识别生僻字的模型，且所述第一文本识别模型根据生僻字库的更新不断进行更新；针对每个所述单字符图像，若所对应的所述第一识别结果与所述第二识别结果相同，将所述第一识别结果或所述第二识别结果作为所述单字符图像的目标识别结果；若所对应的所述第一识别结果与所述第二识别结果不相同，且所述第一识别结果指示所述单字符图像中的单字符为生僻字的情况下，则将所述第一识别结果作为所述单字符图像的目标识别结果。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：若所述单字符图像的第一识别结果与第二识别结果不相同，且所述第一识别结果指示所述单字符图像中的单字符不为生僻字的情况下，则将所述第二识别结果作为所述单字符图像的目标识别结果。3.根据权利要求1或2所述的方法，其特征在于，所述第一文本识别模型包括：特征提取层、仿射变换层和预测层；所述将所述单字符图像输入第一文本识别模型，获得所述第一文本识别模型输出的每个单字符图像的第一识别结果，包括：对所述单字符图像进行下采样，获得下采样特征；将所述单字符图像输入所述第一文本识别模型的特征提取层，获得所述单字符图像的单应矩阵特征；将所述单字符图像的单应矩阵特征，以及所述单字符图像的下采样特征输入所述仿射变换层，获得所述单字符图像的仿射变换矩阵特征；所述仿射变换矩阵特征用于表征所述单字符图像中字符区域的位置信息；将所述单字符图像的仿射变换矩阵特征输入所述预测层，获得所述单字符图像的第一识别结果。4.根据权利要求3所述的方法，其特征在于，所述特征提取层包括依次连接的四个2倍下采样层、两个全连接层；所述预测层包括依次连接的三个2倍下采样层、两个全连接层。5.根据权利要求1所述的方法，其特征在...

【专利技术属性】
技术研发人员：许玉辉，
申请(专利权)人：南京旷云科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人