文本识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:25950835 阅读:24 留言:0更新日期:2020-10-17 03:43
本申请提出一种文本识别方法、装置、电子设备及存储介质。具体实现方案为:识别步骤,对待识别图像中的部分区域进行文本识别,得到部分区域对应的字符串;第一计算步骤,将字符串分别与字表中的每个字符组合成字符串组,并计算各个字符串组的概率;排序步骤,根据概率对各个字符串组进行排序,选取排序在前的预定个数的字符串组;第二计算步骤,计算选取的字符串组的末尾字符的单字符置信度,单字符置信度用于对待识别图像的文本识别结果进行筛选。本申请实施例利用单字符置信度可以对文本识别结果进行有效筛选,大幅提高文本识别的准确率,减少误判。

【技术实现步骤摘要】
文本识别方法、装置、电子设备及存储介质
本申请涉及信息
,尤其涉及一种文本识别方法、装置、电子设备及存储介质。
技术介绍
在采用深度学习算法进行文本识别的过程中,通常将包含文字的图像输入文本识别模型中,得到概率分布矩阵。在得到该概率分布矩阵后,可以通过集束搜索(BeamSearch)进一步确定最终的识别结果。集束搜索是一种启发式图搜索算法。通常用在图的解空间比较大的情况下,在集束搜索的算法执行过程中,为了减少搜索所占用的空间和时间,在每一步深度扩展的时候,会剪掉一些质量比较差的结点,保留下一些质量较高的结点。这种方法可减少空间消耗,并提高时间效率。但是通过集束搜索进一步确定最终的识别结果,仍有可能会导致误判。例如,在拍照批改算法中,有一个默认的规则是“尽可能地将题目判为正确”。因为考虑到正常用户做题时绝大部分题目都能做对,只有少量题目会做错,因此在算法的判题决策中,算法会尽可能地去选择一个能够将题目判为正确的识别结果。如果将上述默认的规则与集束搜索相结合,则有可能会导致误判,从而降低了文本识别的准确率。
技术实现思路
本申请实施例提供一种文本识别方法、装置、电子设备及存储介质,以解决相关技术存在的问题,技术方案如下:第一方面,本申请实施例提供了一种文本识别方法,包括:识别步骤,对待识别图像中的部分区域进行文本识别,得到部分区域对应的字符串;第一计算步骤,将字符串分别与字表中的每个字符组合成字符串组,并计算各个字符串组的概率;排序步骤,根据概率对各个字符串组进行排序,选取排序在前的预定个数的字符串组;第二计算步骤,计算选取的字符串组的末尾字符的单字符置信度,单字符置信度用于对待识别图像的文本识别结果进行筛选。在一种实施方式中,将字符串分别与字表中的每个字符组合成字符串组,包括:将字符串分别与字表中的每个字符组合,得到组合串组;对组合串组进行规范化处理,得到字符串组。在一种实施方式中,对组合串组进行规范化处理,得到字符串组,包括采用以下方式中的至少一种对组合串组进行规范化处理:去除组合串组中处于非末尾位置上的空字符;在组合串组中的两个相邻的字符是相同字符的情况下,去掉两个相邻的字符中的一个字符。在一种实施方式中,计算选取的字符串组的末尾字符的单字符置信度,包括:从选取的字符串组中,将末尾字符为空字符的字符串组过滤掉;计算过滤后的字符串组的末尾字符的单字符置信度。在一种实施方式中,计算选取的字符串组的末尾字符的单字符置信度,包括:在末尾字符与末尾字符的前一个字符是相同字符的情况下,利用以下单字符置信度公式计算单字符置信度;单字符置信度公式为:p=1-(1-p1)×(1-p2),其中,p表示单字符置信度,p2表示末尾字符的概率,p1表示末尾字符的前一个字符的概率。在一种实施方式中,上述方法还包括:将待识别图像划分成多个区域;在每次执行识别步骤之前,将待识别图像的第一个区域到当前识别区域组成的连续区域,构成与当前识别区域对应的部分区域;在每次执行识别步骤之后,对于部分区域对应的字符串,执行第一计算步骤、排序步骤和第二计算步骤,得到每个部分区域对应的单字符置信度。在一种实施方式中,上述方法还包括:根据每个部分区域对应的单字符置信度,对待识别图像的文本识别结果进行筛选。在一种实施方式中,根据每个部分区域对应的单字符置信度,对待识别图像的文本识别结果进行筛选,包括:计算每个部分区域对应的任意两个单字符置信度之间的差别程度;在差别程度大于预定阈值的情况下,从待识别图像的文本识别结果中,将两个单字符置信度中较小的一个单字符置信度对应的文本识别结果筛选掉。第二方面,本申请实施例提供了一种文本识别装置,包括:识别单元,用于对待识别图像中的部分区域进行文本识别,得到部分区域对应的字符串;第一计算单元,用于将字符串分别与字表中的每个字符组合成字符串组,并计算各个字符串组的概率;排序单元,用于根据概率对各个字符串组进行排序,选取排序在前的预定个数的字符串组;第二计算单元,用于计算选取的字符串组的末尾字符的单字符置信度,单字符置信度用于对待识别图像的文本识别结果进行筛选。在一种实施方式中,第一计算单元包括:组合子单元,用于将字符串分别与字表中的每个字符组合,得到组合串组;处理子单元,用于对组合串组进行规范化处理,得到字符串组。在一种实施方式中,处理子单元用于:去除组合串组中处于非末尾位置上的空字符;在组合串组中的两个相邻的字符是相同字符的情况下,去掉两个相邻的字符中的一个字符。在一种实施方式中,第二计算单元还用于:从选取的字符串组中,将末尾字符为空字符的字符串组过滤掉;计算过滤后的字符串组的末尾字符的单字符置信度。在一种实施方式中,第二计算单元用于:在末尾字符与末尾字符的前一个字符是相同字符的情况下,利用以下单字符置信度公式计算单字符置信度;单字符置信度公式为:p=1-(1-p1)×(1-p2),其中,p表示单字符置信度,p2表示末尾字符的概率,p1表示末尾字符的前一个字符的概率。在一种实施方式中,上述装置还包括:划分单元,用于将待识别图像划分成多个区域;将待识别图像的第一个区域到当前识别区域组成的连续区域,构成与当前识别区域对应的部分区域;遍历单元,用于对于部分区域对应的字符串,执行第一计算单元、排序单元和第二计算单元所执行的功能,得到每个部分区域对应的单字符置信度。在一种实施方式中,上述装置还包括筛选单元,用于:根据每个部分区域对应的单字符置信度,对待识别图像的文本识别结果进行筛选。在一种实施方式中,筛选单元用于:计算每个部分区域对应的任意两个单字符置信度之间的差别程度;在差别程度大于预定阈值的情况下,从待识别图像的文本识别结果中,将两个单字符置信度中较小的一个单字符置信度对应的文本识别结果筛选掉。第三方面,本申请实施例提供了一种电子设备,该设备包括:存储器和处理器。其中,该存储器和该处理器通过内部连接通路互相通信,该存储器用于存储指令,该处理器用于执行该存储器存储的指令,并且当该处理器执行该存储器存储的指令时,使得该处理器执行上述各方面任一种实施方式中的方法。第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储计算机程序,当计算机程序在计算机上运行时,上述各方面任一种实施方式中的方法被执行。上述技术方案中的优点或有益效果至少包括:利用单字符置信度可以对文本识别结果进行有效筛选,大幅提高文本识别的准确率,减少误判。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本申请进一步的方面、实施方式和特征本文档来自技高网...

【技术保护点】
1.一种文本识别方法,其特征在于,包括:/n识别步骤,对待识别图像中的部分区域进行文本识别,得到所述部分区域对应的字符串;/n第一计算步骤,将所述字符串分别与字表中的每个字符组合成字符串组,并计算各个所述字符串组的概率;/n排序步骤,根据概率对各个所述字符串组进行排序,选取排序在前的预定个数的字符串组;/n第二计算步骤,计算选取的字符串组的末尾字符的单字符置信度,所述单字符置信度用于对所述待识别图像的文本识别结果进行筛选。/n

【技术特征摘要】
1.一种文本识别方法,其特征在于,包括:
识别步骤,对待识别图像中的部分区域进行文本识别,得到所述部分区域对应的字符串;
第一计算步骤,将所述字符串分别与字表中的每个字符组合成字符串组,并计算各个所述字符串组的概率;
排序步骤,根据概率对各个所述字符串组进行排序,选取排序在前的预定个数的字符串组;
第二计算步骤,计算选取的字符串组的末尾字符的单字符置信度,所述单字符置信度用于对所述待识别图像的文本识别结果进行筛选。


2.根据权利要求1所述的方法,其特征在于,将所述字符串分别与字表中的每个字符组合成字符串组,包括:
将所述字符串分别与字表中的每个字符组合,得到组合串组;
对所述组合串组进行规范化处理,得到所述字符串组。


3.根据权利要求2所述的方法,其特征在于,对所述组合串组进行规范化处理,得到所述字符串组,包括采用以下方式中的至少一种对所述组合串组进行规范化处理:
去除所述组合串组中处于非末尾位置上的空字符;
在所述组合串组中的两个相邻的字符是相同字符的情况下,去掉所述两个相邻的字符中的一个字符。


4.根据权利要求1所述的方法,其特征在于,计算选取的字符串组的末尾字符的单字符置信度,包括:
从所述选取的字符串组中,将末尾字符为空字符的字符串组过滤掉;
计算过滤后的字符串组的末尾字符的单字符置信度。


5.根据权利要求1所述的方法,其特征在于,计算选取的字符串组的末尾字符的单字符置信度,包括:
在所述末尾字符与所述末尾字符的前一个字符是相同字符的情况下,利用以下单字符置信度公式计算所述单字符置信度;
所述单字符置信度公式为:p=1-(1-p1)×(1-p2),其中,p表示所述单字符置信度,p2表示所述末尾字符的概率,p1表示所述末尾字符的前一个字符的概率。


6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述待识别图像划分成多个区域;
在每次执行所述识别步骤之前,将所述待识别图像的第一个区域到当前识别区域组成的连续区域,构成与所述当前识别区域对应的所述部分区域;
在每次执行所述识别步骤之后,对于所述部分区域对应的字符串,执行所述第一计算步骤、所述排序步骤和所述第二计算步骤,得到每个所述部分区域对应的单字符置信度。


7.根据权利要求1至6中任一项所述的方法,其特征在于,还包括:
根据每个所述部分区域对应的单字符置信度,对所述待识别图像的文本识别结果进行筛选。


8.根据权利要求7所述的方法,其特征在于,根据每个所述部分区域对应的单字符置信度,对所述待识别图像的文本识别结果进行筛选,包括:
计算每个所述部分区域对应的任意两个单字符置信度之间的差别程度;
在所述差别程度大于预定阈值的情况下,从所述待识别图像的文本识别结果中,将两个所述单字符置信度中较小的一个单字符置信度对应的文本识别结果筛选掉。


9.一种文本识别装置,其特征在于,包括:
识别单元,用于对...

【专利技术属性】
技术研发人员:康凯李兵李盼盼
申请(专利权)人:北京易真学思教育科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1