字符识别方法、装置、计算机设备以及存储介质制造方法及图纸

技术编号:34687733 阅读:19 留言:0更新日期:2022-08-27 16:21
本申请提供字符识别方法、装置、计算机设备以及存储介质,其中,方法包括:获取待识别图像,所述待识别图像包含待识别字符;在通过特征提取网络对所述待识别图像进行特征提取的过程中,对所述特征提取网络提取得到的至少一张特征图进行目标向量替换,以得到所述待识别图像对应的目标特征图;其中,目标向量是指在特征图中沿字符方向排列的向量,目标向量替换是指利用特征图中的一目标向量替换特征图中的另一目标向量;基于所述目标特征图进行字符识别,以确定所述待识别图像中的字符。该技术方案充分建立字符之间的关联关系,提高字符识别的准确性。别的准确性。别的准确性。

【技术实现步骤摘要】
字符识别方法、装置、计算机设备以及存储介质


[0001]本申请涉及图像识别领域,尤其涉及字符识别方法、装置、计算机设备以及存储介质。

技术介绍

[0002]光学字符识别(opticalcharacterrecognition,OCR),是指电子设备(如扫描仪或相机等)检测纸质文档上打印的字符,通过检测暗、亮的模式确定其形状,然后通过字符识别方法将形状翻译成文字的过程。在传统的OCR方案中,一般是先利用投影方法切割出单个字符,再将切割出的字符送入卷积神经网络(convolutionalneuralnetworks,CNN)中进行分类。
[0003]随着技术的发展,人们提出了基于深度学习的端到端的OCR识别方案,即不再对字符进行切割,而是将字符识别转化为序列学习的问题,将字符的切割融入到深度学习中,直接对包含字符的文本图像进行文本识别,确定该文本图像中的字符。基于深度学习的端到端的OCR识别方案主要是通过卷积特征提取和序列特征预测后,对预测标签进行翻译转录后输出文字。由于字符之间存在一定的关联关系,在进行字符识别时,如果能够建立起字符之间的相关性,能够提高识别的效率。因此,如何建立字符之间的关联关系,成为了亟需解决的技术问题。

技术实现思路

[0004]本申请提供字符识别方法、装置、计算机设备以及存储介质,以建立字符之间的关联关系,提高字符识别的准确性。
[0005]第一方面,提供一种字符识别方法,包括:
[0006]获取待识别图像,所述待识别图像包含待识别字符;
[0007]在通过特征提取网络对所述待识别图像进行特征提取的过程中,对所述特征提取网络提取得到的至少一张特征图进行目标向量替换,以得到所述待识别图像对应的目标特征图;其中,目标向量是指在特征图中沿字符方向排列的向量,目标向量替换是指利用特征图中的一目标向量替换特征图中的另一目标向量;
[0008]基于所述目标特征图进行字符识别,以确定所述待识别图像中的字符。。
[0009]在该技术方案中,在获取到待识别图像后,在通过特征提取网络对待识别图像进行特征提取的过程中,对特征提取网络提到得到的特征图进行目标向量替换,得到待识别对应的目标特征图,再基于目标特征图进行字符识别,从而确定待识别图像中的字符。其中,目标向量是指在特征图中沿字符方向排列的向量,目标向量替换是指利用特征图中的一个目标向量替换特征图中的另一个目标向量,在特征提取过程中对特征图进行目标向量替换即是指在特征提取过程中将特征图中沿字符方向排列的向量进行替换,由于沿字符方向排列的向量可以指示某个字符的部分特征信息,因此,在特征提取过程中将特征图中沿字符方向排列的向量进行替换能够建立字符之间的联系,使得目标特征图中包含字符之间
的相关性,可以提高字符识别的精度。
[0010]结合第一方面,在一种可能的实现方式中,所述特征提取网络包括多个依次连接的特征提取结构,每个特征提取结构包括至少一个卷积层,其中,相邻的两个特征提取结构中,下一特征提取结构用于对上一特征提取结构输出的特征图集进行特征提取;所述对所述特征提取网络提取得到的至少一张特征图进行目标向量替换,以得到所述待识别图像对应的目标特征图,包括:获取第一特征图集,所述第一特征图集为所述特征提取网络中的第一特征提取结构输出的特征图集,所述第一特征图集包括多张特征图,所述第一特征提取结构为预设结构集合中的任一特征提取结构,所述预设结构集合包括所述特征提取网络中的至少一个特征提取结构;对所述第一特征图集中的至少一张特征图进行目标向量替换,以更新所述第一特征图集,并将更新后的第一特征图集输入至第二特征提取结构,以得到第二特征图集,所述第二特征提取结构为与所述第一特征提取结构连接的下一特征提取结构,所述第二特征图集为所述第二特征提取结构输出的特征图集;将第三特征图集或者更新后的第三特征图集,确定为所述目标特征图,所述第三特征图集为所述特征提取网络中的最后一个特征提取结构输出的特征图集。在特征提取的过程中,通过对部分特征提取结构输出的部分特征图进行目标向量替换来更新特征图,能够使得特征图中既包含字符的特征信息、又包含字符之间的关联信息,从而可以提高字符识别的精度。
[0011]结合第一方面,在一种可能的实现方式中,所述对所述第一特征图集中的至少一张特征图进行目标向量替换,以更新所述第一特征图集,包括:在第一特征图中,对于每一第一目标向量,采用与所述第一目标向量相邻的目标向量替换所述第一目标向量,以得到更新后的第一特征图,所述第一特征图为所述第一特征图集中需进行目标向量替换的特征图,所述第一目标向量为所述第一特征图中待替换的任一目标向量。由于相邻字符之间的相关性更高,在进行目标向量替换时,采用相邻的目标向量来进行替换,能够更好地建立字符之间的关联关系。
[0012]结合第一方面,在一种可能的实现方式中,所述第一特征图集中的至少一张特征图包括所述第一特征图集中的2n张特征图,n为大于或等于1的正整数;所述对所述第一特征图集中的至少一张特征图进行目标向量替换,以更新所述第一特征图集,包括:在第二特征图中,对于每一第二目标向量,采用在第一字符方向上与第二目标向量相邻的目标向量替换所述第二目标向量,以得到更新后的第二特征图,所述第二特征图为所述2n张特征图中的其中n张特征图中的任一特征图,所述第二目标向量为所述第二特征图中待替换的任一目标向量;在第三特征图中,对于每一第三目标向量,采用在第二字符方向上与第三目标向量相邻的目标向量替换所述第三目标向量,以得到更新后的第三特征图,所述第三特征图为所述2n张特征图中的另外n张特征图中的任一特征图,所述第三目标向量为所述第三特征图中待替换的任一目标向量;所述第一字符方向和所述第二字符方向为两个相反的字符方向。在进行目标向量替换时,分别采用两个字符方向上相邻的目标向量来进行替换,可以充分建立相邻字符之间的关联关系,有助于提高字符识别的准确度。
[0013]结合第一方面,在一种可能的实现方式中,所述其中n张特征图为所述第一特征图集中的前n张特征图,所述另外n张特征图为所述第一特征图集中的后n张特征图。
[0014]结合第一方面,在一种可能的实现方式中,所述特征提取网络包括M个特征提取结构,所述预设结构集合包括所述特征提取网络中的第i个特征提取结构,2≤i≤(M

1),M为
大于4的正整数。通过将特征提取网络中除去首尾两个特征提取结构的特征提取结构提取得到特征图均进行目标向量替换,能够充分建立字符之间的关联关系。
[0015]结合第一方面,在一种可能的实现方式中,所述对所述特征提取网络提取得到的至少一张特征图进行目标向量替换之前,还包括:确定所述待识别图像中包含的待识别字符的数量;根据所述待识别字符的数量确定所述至少一张特征图的数量。在进行目标向量替换之前,通过确定待识别字符的数量来确定需进行目标向量替换的数量,能够更合理地建立字符之间的关联关系,从而提高字符识别的精度。
[0016]第二方面,提供一种字符识别装置,包括:本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种字符识别方法,其特征在于,包括:获取待识别图像,所述待识别图像包含待识别字符;在通过特征提取网络对所述待识别图像进行特征提取的过程中,对所述特征提取网络提取得到的至少一张特征图进行目标向量替换,以得到所述待识别图像对应的目标特征图;其中,目标向量是指在特征图中沿字符方向排列的向量,目标向量替换是指利用特征图中的一目标向量替换特征图中的另一目标向量;基于所述目标特征图进行字符识别,以确定所述待识别图像中的字符。2.根据权利要求1所述的方法,其特征在于,所述特征提取网络包括多个依次连接的特征提取结构,每个特征提取结构包括至少一个卷积层,其中,相邻的两个特征提取结构中,下一特征提取结构用于对上一特征提取结构输出的特征图集进行特征提取;所述对所述特征提取网络提取得到的至少一张特征图进行目标向量替换,以得到所述待识别图像对应的目标特征图,包括:获取第一特征图集,所述第一特征图集为所述特征提取网络中的第一特征提取结构输出的特征图集,所述第一特征图集包括多张特征图,所述第一特征提取结构为预设结构集合中的任一特征提取结构,所述预设结构集合包括所述特征提取网络中的至少一个特征提取结构;对所述第一特征图集中的至少一张特征图进行目标向量替换,以更新所述第一特征图集,并将更新后的第一特征图集输入至第二特征提取结构,以得到第二特征图集,所述第二特征提取结构为与所述第一特征提取结构连接的下一特征提取结构,所述第二特征图集为所述第二特征提取结构输出的特征图集;将第三特征图集或者更新后的第三特征图集,确定为所述目标特征图,所述第三特征图集为所述特征提取网络中的最后一个特征提取结构输出的特征图集。3.根据权利要求2所述的方法,其特征在于,所述对所述第一特征图集中的至少一张特征图进行目标向量替换,以更新所述第一特征图集,包括:在第一特征图中,对于每一第一目标向量,采用与所述第一目标向量相邻的目标向量替换所述第一目标向量,以得到更新后的第一特征图,所述第一特征图为所述第一特征图集中需进行目标向量替换的特征图,所述第一目标向量为所述第一特征图中待替换的任一目标向量。4.根据权利要求2所述的方法,其特征在于,所述第一特征图集中的至少一张特征图包括所述第一特征图集中的2n张特征图,n为大于或等于1的正整数;所述对所述第一特征图集中的至少一张特征图进行目标向量替换,以更新所述第一特征图集,包括:在第二特征图中,对于每一第二目标向量,采用在第一字符方向上与第二目标向量相邻的目标向量替换...

【专利技术属性】
技术研发人员:申啸尘周有喜
申请(专利权)人:深圳市爱深盈通信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1