【技术实现步骤摘要】
文本识别方法、装置、电子设备和存储介质
[0001]本专利技术涉及图像处理
,尤其涉及文本识别方法、装置、电子设备和存储介质。
技术介绍
[0002]自然场景文字识别是带文字的图片中识别出字符序列的过程,示例性的,对于中文,一个字符可为一个汉字,对于英文,一个字符可为一个字母。它是一项具有极大挑战性的课题,除了图片背景复杂,光照变化等因素外,识别输出空间的复杂性也是一大困难,由于文字由数量不固定的字符组成,因此,自然场景文字识别需要从图片中识别长度不固定的序列。相关技术中使用序列到序列的方法,先将图像编码,然后进行序列解码得出整个字符串。然而该方法存在识别结果多识别字符或漏识别字符的问题。
技术实现思路
[0003]本公开提供了一种文本识别方法、装置、电子设备和存储介质,以至少解决相关技术中文本识别存在识别结果多识别字符或漏识别字符的问题。
[0004]根据本公开的一方面,提供了一种文本识别方法,包括:获取文本图像,其中,文本图像记录有单行文本;使用文本识别神经网络的第一特征提取子网络处理文本图 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种文本识别方法,其特征在于,包括:获取文本图像,其中,所述文本图像记录有单行文本;使用文本识别神经网络的第一特征提取子网络处理所述文本图像以生成第一特征映射;使用所述文本识别神经网络的第二特征提取子网络在N个方向上从所述第一特征映射提取特征映射,得到第二特征映射,其中,N为大于等于2的自然数;使用所述文本识别神经网络的输出子网络处理所述第二特征映射,以生成文本识别输出。2.如权利要求1所述的文本识别方法,其特征在于,所述文本识别神经网络还包括:编码器子网络和融合单元,其中,所述文本识别方法,还包括:使用所述编码器子网络处理所述第一特征映射以生成特征向量;使用所述融合单元按照融合规则将所述特征向量和所述第二特征映射进行融合,以生成融合输出;所述使用所述文本识别神经网络的输出子网络处理所述第二特征映射,以生成文本识别输出,包括:使用所述文本识别神经网络的输出子网络处理所述融合输出,以生成文本识别输出。3.如权利要求1或2所述的文本识别方法,其特征在于,所述使用所述文本识别神经网络的第二特征提取子网络在N个方向上从所述第一特征映射提取特征映射,得到第二特征映射,包括:通过所述第二特征提取子网络按照N
‑
1个方向旋转所述第一特征映射,得到相应的N
‑
1个第三特征映射;通过所述第二特征提取子网络,处理所述第一特征映射和所述N
‑
1个第三特征映射以生成第二特征映射。4.如权利要求3所述的文本识别方法,其特征在于,所述第二特征提取子网络包括N个特征提取分支,其中,所述通过所述第二特征提取子网络按照N
‑
1个方向旋转所述第一特征映射,得到相应的N
‑
1个第三特征映射,包括:通过N
‑
1个特征提取分支中的每个特征提取分支,按照对应的方向旋转所述第一特征映射,得到对应的第三特征映射。5.如权利要求4所述的文本识别方法,其特征在于,所述第二特征提取子网络包括整合单元,其中,所述通过所述第二特征提取子网络处理所述第一特征映射和所述N
‑
1个第三特征映射以生成第二特征映射,包括:通过所述N
‑
1个特征提取分支中相应的特征提取分支处理相应的第三特征映射,以及通过剩余的一个特征提取分支处理所述第一特征映射;通过所述整合单元按照预设整合规则处理所述N个特征提取分支的输出,以生成所述第二特征映射。6.如权利要求3所述的文本识别方法,其特征在于,所述N
‑
1个方向包括:一个或多个预设方向,以及一个或多个随机方向。7.如权利要求5所述的文本识别方法,其特征在于,通过所述整合单元按照预设整合规
技术研发人员:秦勇,
申请(专利权)人:北京易真学思教育科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。