一种文本识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号:24853620 阅读:24 留言:0更新日期:2020-07-10 19:07
本申请涉及文本识别技术领域,提供一种文本识别方法、装置、存储介质及电子设备。其中,文本识别方法包括:获取待识别的文本行图像;利用卷积神经网络提取文本行图像的朝向不变特征,朝向不变特征是指与所述文本行图像中的文本朝向无关的特征;将朝向不变特征输入至依次设置的长短时记忆网络和连接时序分类器进行处理,获得所述文本行图像的文本识别结果。上述方法中通过卷积神经网络提取到的朝向不变特征不受文本行图像中的文本朝向的影响,从而,基于该特征去做文本识别,识别结果也不受文本行图像中的文本朝向影响。因此该方法能够有效处理包含各种文本朝向的图像,显著拓展了文本识别技术的应用范围。

【技术实现步骤摘要】
一种文本识别方法、装置、存储介质及电子设备
本专利技术涉及文本识别
,具体而言,涉及一种文本识别方法、装置、存储介质及电子设备。
技术介绍
近年来,通过广大学者的研究,文本检测和识别的性能已经有了长足的进步。目前,主流的检测和识别方法都是基于文本行的,其基本流程是:先使用检测算法得到文本行图像的范围,然后从输入图像中切出局部的文本行图像,再将文本行图像输入识别网络得到识别结果,最后将文本行图像在输入图像中的坐标和识别出的字符串返回给调用者。上面的基本流程中,有一个关键的假设必不可少,即切出图像中的文本行都是(或者大致上是)水平且朝上的(文本朝向指字符的字头朝向),因此可以直接输入至识别网络处理。或者,在一些改进方案中,还可以先设法确定文本行与水平方向的较小夹角(小于90度的角),然后按此夹角方向旋转局部图像,最后从中旋转后的局部图像中切出文本行图像再进行识别。以图1为例,“螺口弯针头”、“规格15G-27G”、“管长15mm”三个文本行行是水平且朝上的,“1.5英寸”、“鑫源电子产品”两个文本行根据与水平方向的较小夹角分别逆时针和本文档来自技高网...

【技术保护点】
1.一种文本识别方法,其特征在于,包括:/n获取待识别的文本行图像;/n利用卷积神经网络提取所述文本行图像的朝向不变特征,所述朝向不变特征是指与所述文本行图像中的文本朝向无关的特征;/n将所述朝向不变特征输入至依次设置的长短时记忆网络和连接时序分类器进行处理,获得所述文本行图像的文本识别结果。/n

【技术特征摘要】
1.一种文本识别方法,其特征在于,包括:
获取待识别的文本行图像;
利用卷积神经网络提取所述文本行图像的朝向不变特征,所述朝向不变特征是指与所述文本行图像中的文本朝向无关的特征;
将所述朝向不变特征输入至依次设置的长短时记忆网络和连接时序分类器进行处理,获得所述文本行图像的文本识别结果。


2.根据权利要求1所述的文本识别方法,其特征在于,所述卷积神经网络包括至少一个方向卷积层,以及,在所述至少一个方向卷积层之后依次设置的反向旋转层和编码层,所述利用卷积神经网络提取所述文本行图像的朝向不变特征,包括:
所述方向卷积层利用每K个一组的卷积核对该层的输入特征图进行卷积,并输出每组卷积核卷积后得到K个相应的特征通道;其中,K为大于1的正整数,表示需要识别的文本朝向的总数量,每组中的K个卷积核由该组中的基准卷积核按照K个文本朝向旋转后产生;
所述反向旋转层对该层的输入特征图中的K个特征通道进行旋转,并输出特征通道旋转后的特征图;其中,每个特征通道的旋转方式与生成该特征通道时采用的卷积核相对于所述基准卷积核的旋转方式相反;
所述编码层对该层的输入特征图中的K个特征通道进行编码,并输出特征通道编码后的特征图;其中,编码是指将该层的输入特征图与特征通道的排列顺序去相关化的操作,所述编码层的输出特征图具有朝向不变性,该特征图为所述朝向不变特征,或者,该特征图经所述卷积神经网络位于所述编码层之后的部分处理后能够得到所述朝向不变特征。


3.根据权利要求2所述的文本识别方法,其特征在于,所述至少一个方向卷积层设置于所述卷积神经网络的开始位置。


4.根据权利要求2所述的文本识别方法,其特征在于,K=4,需要识别的文本朝向包括上、右、下、左4个方向。


5.根据权利要求2所述的文本识别方法,其特征在于,所述卷积神经网络在所述方向卷积层之前的层的参数被配置为使得所述反向旋转层的输入特征图为正方形。


6.根据权利要求2所述的文本识别方法,其特征在于,所述卷积神经网络在所述向旋转层和所述编码层之间还设置有尺度变换层,在所述反向旋转层对该层的输入特征图中的K个特征通道进行旋转之后,以及在所述编码层对该层的...

【专利技术属性】
技术研发人员:李衡峰李晶
申请(专利权)人:北京远鉴信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1