文本识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：25950835 阅读：24 留言：0更新日期：2020-10-17 03:43

本申请提出一种文本识别方法、装置、电子设备及存储介质。具体实现方案为：识别步骤，对待识别图像中的部分区域进行文本识别，得到部分区域对应的字符串；第一计算步骤，将字符串分别与字表中的每个字符组合成字符串组，并计算各个字符串组的概率；排序步骤，根据概率对各个字符串组进行排序，选取排序在前的预定个数的字符串组；第二计算步骤，计算选取的字符串组的末尾字符的单字符置信度，单字符置信度用于对待识别图像的文本识别结果进行筛选。本申请实施例利用单字符置信度可以对文本识别结果进行有效筛选，大幅提高文本识别的准确率，减少误判。

全部详细技术资料下载

【技术实现步骤摘要】
文本识别方法、装置、电子设备及存储介质
本申请涉及信息
，尤其涉及一种文本识别方法、装置、电子设备及存储介质。
技术介绍
在采用深度学习算法进行文本识别的过程中，通常将包含文字的图像输入文本识别模型中，得到概率分布矩阵。在得到该概率分布矩阵后，可以通过集束搜索(BeamSearch)进一步确定最终的识别结果。集束搜索是一种启发式图搜索算法。通常用在图的解空间比较大的情况下，在集束搜索的算法执行过程中，为了减少搜索所占用的空间和时间，在每一步深度扩展的时候，会剪掉一些质量比较差的结点，保留下一些质量较高的结点。这种方法可减少空间消耗，并提高时间效率。但是通过集束搜索进一步确定最终的识别结果，仍有可能会导致误判。例如，在拍照批改算法中，有一个默认的规则是“尽可能地将题目判为正确”。因为考虑到正常用户做题时绝大部分题目都能做对，只有少量题目会做错，因此在算法的判题决策中，算法会尽可能地去选择一个能够将题目判为正确的识别结果。如果将上述默认的规则与集束搜索相结合，则有可能会导致误判，从而降低了文本识别的准确率。
技术实现思路
本申请实施例提供一种文本识别方法、装置、电子设备及存储介质，以解决相关技术存在的问题，技术方案如下：第一方面，本申请实施例提供了一种文本识别方法，包括：识别步骤，对待识别图像中的部分区域进行文本识别，得到部分区域对应的字符串；第一计算步骤，将字符串分别与字表中的每个字符组合成字符串组，并计算各个字符串组的概率；排序步骤，根据概率对...

【技术保护点】
1.一种文本识别方法，其特征在于，包括：/n识别步骤，对待识别图像中的部分区域进行文本识别，得到所述部分区域对应的字符串；/n第一计算步骤，将所述字符串分别与字表中的每个字符组合成字符串组，并计算各个所述字符串组的概率；/n排序步骤，根据概率对各个所述字符串组进行排序，选取排序在前的预定个数的字符串组；/n第二计算步骤，计算选取的字符串组的末尾字符的单字符置信度，所述单字符置信度用于对所述待识别图像的文本识别结果进行筛选。/n

【技术特征摘要】
1.一种文本识别方法，其特征在于，包括：
识别步骤，对待识别图像中的部分区域进行文本识别，得到所述部分区域对应的字符串；
第一计算步骤，将所述字符串分别与字表中的每个字符组合成字符串组，并计算各个所述字符串组的概率；
排序步骤，根据概率对各个所述字符串组进行排序，选取排序在前的预定个数的字符串组；
第二计算步骤，计算选取的字符串组的末尾字符的单字符置信度，所述单字符置信度用于对所述待识别图像的文本识别结果进行筛选。

2.根据权利要求1所述的方法，其特征在于，将所述字符串分别与字表中的每个字符组合成字符串组，包括：
将所述字符串分别与字表中的每个字符组合，得到组合串组；
对所述组合串组进行规范化处理，得到所述字符串组。

3.根据权利要求2所述的方法，其特征在于，对所述组合串组进行规范化处理，得到所述字符串组，包括采用以下方式中的至少一种对所述组合串组进行规范化处理：
去除所述组合串组中处于非末尾位置上的空字符；
在所述组合串组中的两个相邻的字符是相同字符的情况下，去掉所述两个相邻的字符中的一个字符。

4.根据权利要求1所述的方法，其特征在于，计算选取的字符串组的末尾字符的单字符置信度，包括：
从所述选取的字符串组中，将末尾字符为空字符的字符串组过滤掉；
计算过滤后的字符串组的末尾字符的单字符置信度。

5.根据权利要求1所述的方法，其特征在于，计算选取的字符串组的末尾字符的单字符置信度，包括：
在所述末尾字符与所述末尾字符的前一个字符是相同字符的情况下，利用以下单字符置信度公式计算所述单字符置信度；
所述单字符置信度公式为：p＝1-(1-p1)×(1-p2)，其中，p表示所述单字符置信度，p2表示所述末尾字符的概率，p1表示所述末尾字符的前一个字符的概率。

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：
将所述待识别图像划分成多个区域；
在每次执行所述识别步骤之前，将所述待识别图像的第一个区域到当前识别区域组成的连续区域，构成与所述当前识别区域对应的所述部分区域；
在每次执行所述识别步骤之后，对于所述部分区域对应的字符串，执行所述第一计算步骤、所述排序步骤和所述第二计算步骤，得到每个所述部分区域对应的单字符置信度。

7.根据权利要求1至6中任一项所述的方法，其特征在于，还包括：
根据每个所述部分区域对应的单字符置信度，对所述待识别图像的文本识别结果进行筛选。

8.根据权利要求7所述的方法，其特征在于，根据每个所述部分区域对应的单字符置信度，对所述待识别图像的文本识别结果进行筛选，包括：
计算每个所述部分区域对应的任意两个单字符置信度之间的差别程度；
在所述差别程度大于预定阈值的情况下，从所述待识别图像的文本识别结果中，将两个所述单字符置信度中较小的一个单字符置信度对应的文本识别结果筛选掉。

9.一种文本识别装置，其特征在于，包括：
识别单元，用于对...

【专利技术属性】
技术研发人员：康凯，李兵，李盼盼，
申请(专利权)人：北京易真学思教育科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人