文字识别方法及装置、电子设备和存储介质制造方法及图纸

技术编号:20844001 阅读:28 留言:0更新日期:2019-04-13 08:53
本公开涉及一种文字识别方法及装置、电子设备和存储介质,所述方法包括:对待检测图像进行特征提取处理,获得语义向量;根据语义向量,预测待检测图像中的文字序列的文字数量;根据文字数量,确定位置向量;根据位置向量和语义向量,识别文字序列。根据本公开的实施例的文字识别方法,可获得待检测图像中的文字序列的位置向量,并根据位置向量和语义向量识别文字序列,可以以位置向量为识别依据,一次性识别所有文字,处理效率高,并且,一次性识别所有文字的方法不依赖过去的识别结果,避免了不可控的长期依赖问题。

【技术实现步骤摘要】
文字识别方法及装置、电子设备和存储介质
本公开涉及计算机
,尤其涉及一种文字识别方法及装置、电子设备和存储介质。
技术介绍
在相关技术中,可通过神经网络等方法,识别图像中的文字,然而,该方法仅可按照文字顺序每次输出一个或几个字符,无法一次同时输出所有字符,识别速度慢,运行效率较低,并且,该方法通常依赖前一个或多个文字作为当前文字的识别依据,因此,该方法有长期依赖问题,即,以多次之前识别出的文字作为当前文字的识别依据,造成当前文字的识别结果不准确。
技术实现思路
本公开提出了一种文字识别方法及装置、电子设备和存储介质。根据本公开的一方面,提供了一种文字识别方法,包括:对待检测图像进行特征提取处理,获得与所述待检测图像中的文字序列对应的语义向量;根据所述语义向量,预测待检测图像中的文字序列的文字数量;根据所述文字数量,确定与所述文字序列对应的位置向量;根据所述位置向量和所述语义向量,识别所述文字序列。根据本公开的实施例的文字识别方法,可获得待检测图像中的文字序列的位置向量,并根据位置向量和语义向量识别文字序列,可以以位置向量为识别依据,一次性识别所有文字,处理效率高,并且,一次性识别所有文字的方法不依赖过去的识别结果,避免了不可控的长期依赖问题。在一种可能的实现方式中,根据所述位置向量和所述语义向量,识别所述文字序列,包括:根据所述位置向量和所述语义向量,确定权值矩阵;根据所述权值矩阵和所述语义向量,识别所述文字序列。通过这种方式,可根据数字序列和语义向量获得权值矩阵,所述权值矩阵可具有文字序列中的文字的数量、排序和语义信息,可用于一次性识别文字序列中的所有文字,提高了识别文字的速度,并且避免了不可控的长依赖问题,提高了识别的准确率。在一种可能的实现方式中,根据所述数字序列和所述语义向量,确定权值矩阵,包括:对所述位置向量进行卷积处理,获得与所述数字序列对应的第一特征向量;对所述语义向量进行卷积处理,获得第二特征向量;将所述第一特征向量和所述第二特征向量相乘,获得所述权值矩阵。在一种可能的实现方式中,根据所述权值矩阵和所述语义向量,识别所述文字序列,包括:将所述权值矩阵与所述第二特征向量相乘,获得概率分布向量;根据所述概率分布向量,确定所述文字序列中的文字。在一种可能的实现方式中,根据所述文字数量,确定与所述文字序列对应的位置向量,包括:根据所述文字数量,确定与所述文字序列对应的数字序列;对所述数字序列进行词嵌入处理,获得与所述数字序列对应的位置向量。在一种可能的实现方式中,所述文字数量为n,所述数字序列为从1到n的正整数组成的序列。在一种可能的实现方式中,对待检测图像进行特征提取处理,获得与所述待检测图像中的文字序列对应的语义向量,包括:对所述待检测图像进行卷积处理,获得所述待检测图像的特征图;对所述特征图进行下采样处理,获得与所述待检测图像中的文字序列对应的语义向量。通过这种方式,可通过特征提取处理降低文字识别的复杂度,提高文字识别的效率。在一种可能的实现方式中,通过第一网络对待检测图像进行特征提取处理,获得与所述待检测图像中的文字序列对应的语义向量,其中,所述方法还包括:通过包括多个第一样本图像的图像集,训练所述第一网络,其中,所述第一样本图像包括一个或多个文字。在一种可能的实现方式中,通过第二网络根据所述位置向量和所述语义向量,确定权值矩阵,其中,所述方法还包括:通过包括多个第二样本图像的图像集,训练所述第二网络,其中,所述第二样本图像包括一个或多个文字。根据本公开的另一方面,提供了一种文字识别装置,包括:特征提取模块,用于对待检测图像进行特征提取处理,获得与所述待检测图像中的文字序列对应的语义向量;预测模块,用于根据所述语义向量,预测待检测图像中的文字序列的文字数量;确定模块,用于根据所述文字数量,确定与所述文字序列对应的位置向量;识别模块,用于根据所述位置向量和所述语义向量,识别所述文字序列。在一种可能的实现方式中,所述识别模块被进一步配置为:根据所述位置向量和所述语义向量,确定权值矩阵;根据所述权值矩阵和所述语义向量,识别所述文字序列。在一种可能的实现方式中,所述识别模块被进一步配置为:对所述位置向量进行卷积处理,获得与所述数字序列对应的第一特征向量;对所述语义向量进行卷积处理,获得第二特征向量;将所述第一特征向量和所述第二特征向量相乘,获得所述权值矩阵。在一种可能的实现方式中,所述识别模块被进一步配置为:将所述权值矩阵与所述第二特征向量相乘,获得概率分布向量;根据所述概率分布向量,确定所述文字序列中的文字。在一种可能的实现方式中,所述确定模块被进一步配置为:根据所述文字数量,确定与所述文字序列对应的数字序列;对所述数字序列进行词嵌入处理,获得与所述数字序列对应的位置向量。在一种可能的实现方式中,所述文字数量为n,所述数字序列为从1到n的正整数组成的序列。在一种可能的实现方式中,所述特征提取模块被进一步配置为:对所述待检测图像进行卷积处理,获得所述待检测图像的特征图;对所述特征图进行下采样处理,获得与所述待检测图像中的文字序列对应的语义向量。在一种可能的实现方式中,所述特征提取模块被进一步配置为:通过第一网络对待检测图像进行特征提取处理,获得与所述待检测图像中的文字序列对应的语义向量,其中,所述装置还包括:第一训练模块,用于通过包括多个第一样本图像的图像集,训练所述第一网络,其中,所述第一样本图像包括一个或多个文字。在一种可能的实现方式中,所述识别模块被进一步配置为:通过第二网络根据所述位置向量和所述语义向量,确定权值矩阵,其中,所述装置还包括:第二训练模块,用于通过包括多个第二样本图像的图像集,训练所述第二网络,其中,所述第二样本图像包括一个或多个文字。根据本公开的另一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:执行上述文字识别方法。根据本公开的另一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述文字识别方法。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。附图说明此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。图1示出根据本公开实施例的文字识别方法的流程图;图2示出根据本公开实施例的文字识别方法的流程图;图3示出根据本公开实施例的文字识别方法的流程图;图4示出根据本公开实施例的文字识别方法的应用示意图;图5示出根据本公开实施例的文字识别装置的框图;图6示出根据本公开实施例的文字识别装置的框图;图7示出根据本公开实施例的电子设备的框图;图8示出根据本公开实施例的电子设备的框图。具体实施方式以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施本文档来自技高网...

【技术保护点】
1.一种文字识别方法,其特征在于,包括:对待检测图像进行特征提取处理,获得与所述待检测图像中的文字序列对应的语义向量;根据所述语义向量,预测待检测图像中的文字序列的文字数量;根据所述文字数量,确定与所述文字序列对应的位置向量;根据所述位置向量和所述语义向量,识别所述文字序列。

【技术特征摘要】
1.一种文字识别方法,其特征在于,包括:对待检测图像进行特征提取处理,获得与所述待检测图像中的文字序列对应的语义向量;根据所述语义向量,预测待检测图像中的文字序列的文字数量;根据所述文字数量,确定与所述文字序列对应的位置向量;根据所述位置向量和所述语义向量,识别所述文字序列。2.根据权利要求1所述的方法,其特征在于,根据所述位置向量和所述语义向量,识别所述文字序列,包括:根据所述位置向量和所述语义向量,确定权值矩阵;根据所述权值矩阵和所述语义向量,识别所述文字序列。3.根据权利要求2所述的方法,其特征在于,根据所述数字序列和所述语义向量,确定权值矩阵,包括:对所述位置向量进行卷积处理,获得与所述数字序列对应的第一特征向量;对所述语义向量进行卷积处理,获得第二特征向量;将所述第一特征向量和所述第二特征向量相乘,获得所述权值矩阵。4.根据权利要求2所述的方法,其特征在于,根据所述权值矩阵和所述语义向量,识别所述文字序列,包括:将所述权值矩阵与所述第二特征向量相乘,获得概率分布向量;根据所述概率分布向量,确定所述文字序列中的文字。5.根据权利要求1-4中任一项所述的方法,其特征在于,根据所述文字数量,确定与所述文字序列对应的位置向量,包括:根据所述文字数量,确定与所述文...

【专利技术属性】
技术研发人员:尹天舒刘学博
申请(专利权)人:北京市商汤科技开发有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1