一种文本识别网络、神经网络训练的方法以及相关设备技术

技术编号:26531700 阅读:29 留言:0更新日期:2020-12-01 14:13
本申请涉及人工智能领域中的文本识别技术,公开了一种文本识别网络、神经网络训练的方法以及相关设备,文本识别网络为用于识别图像中字符的神经网络,文本识别网络包括图像特征提取模块,用于获取待识别图像,并对待识别图像进行特征提取,以生成与待识别图像中的第一字符对应的第一特征;文本特征获取模块,用于获取与待识别图像中的第一字符对应的预设字符,并根据预设字符进行文本预测,以生成第一预测字符的语义特征;识别模块,用于根据第一特征和第一预测字符的语义特征执行识别操作,以生成与待识别图像对应的识别结果,根据更多维度的特征执行识别操作;且图像质量问题不会影响预测字符的准确度,有利于提高文本识别结果的准确度。

【技术实现步骤摘要】
一种文本识别网络、神经网络训练的方法以及相关设备
本申请涉及人工智能领域,尤其涉及一种文本识别网络、神经网络训练的方法以及相关设备。
技术介绍
人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。目前,基于深度学习(deeplearning)的神经网络识别图像中的字符是人工智能常见的一个应用方式。但是,在实际情况中,当待识别图像的质量较低,例如待识别图像模糊或待识别图像中部分字符被遮挡等情况时,都可能会导致神经网络输出错误的识别结果,从而降低文本识别结果的准确率。因此,一种提高文本识别结果准确率的方案亟待推出。
技术实现思路
本申请实施例提供了一种文本识别网络、神经网络本文档来自技高网...

【技术保护点】
1.一种文本识别网络,其特征在于,所述文本识别网络为用于识别图像中字符的神经网络,所述文本识别网络包括图像特征提取模块、文本特征获取模块和识别模块;/n所述图像特征提取模块,用于获取待识别图像,并对所述待识别图像进行特征提取,以生成与所述待识别图像中的第一字符对应的第一特征,其中,所述第一字符为所述待识别图像中需要进行识别的字符;/n所述文本特征获取模块,用于获取与所述待识别图像中的第一字符对应的预设字符,并根据所述预设字符进行文本预测,以生成第一预测字符的语义特征;/n所述识别模块,用于根据所述第一特征和所述第一预测字符的语义特征执行识别操作,以生成与所述待识别图像中的第一字符对应的识别结果...

【技术特征摘要】
1.一种文本识别网络,其特征在于,所述文本识别网络为用于识别图像中字符的神经网络,所述文本识别网络包括图像特征提取模块、文本特征获取模块和识别模块;
所述图像特征提取模块,用于获取待识别图像,并对所述待识别图像进行特征提取,以生成与所述待识别图像中的第一字符对应的第一特征,其中,所述第一字符为所述待识别图像中需要进行识别的字符;
所述文本特征获取模块,用于获取与所述待识别图像中的第一字符对应的预设字符,并根据所述预设字符进行文本预测,以生成第一预测字符的语义特征;
所述识别模块,用于根据所述第一特征和所述第一预测字符的语义特征执行识别操作,以生成与所述待识别图像中的第一字符对应的识别结果。


2.根据权利要求1所述的网络,其特征在于,
所述文本特征获取模块,具体用于在初次对所述待识别图像执行识别操作的情况下,获取与所述待识别图像中的第一字符对应的预设字符,并根据所述预设字符进行文本预测,以生成所述第一预测字符的语义特征;
所述文本特征获取模块,还用于在已对所述第一字符中至少一个字符执行过识别操作的情况下,将与所述第一字符中的已识别字符对应的识别结果确定为第二字符,并根据所述第二字符进行文本预测,以生成与所述第二字符对应的第二预测字符的语义特征。


3.根据权利要求2所述的网络,其特征在于,
所述识别模块,还用于根据所述第一特征和所述第二预测字符的语义特征执行识别操作,以生成与所述待识别图像中的第一字符对应的识别结果。


4.根据权利要求1至3任一项所述的网络,其特征在于,所述文本特征获取模块包括:
第一生成子模块,用于对所述预设字符进行向量化处理,以生成所述预设字符的字符编码,并根据所述预设字符在所述待识别图像中的第一字符的位置,生成所述预设字符的位置编码;
组合子模块,用于将所述预设字符的字符编码和所述预设字符的位置编码进行组合,得到所述预设字符的初始特征,并根据所述预设字符的初始特征执行自注意力编码操作和自注意力解码操作,以生成所述第一预测字符的语义特征。


5.根据权利要求1至3任一项所述的网络,其特征在于,所述识别模块包括:
计算子模块,用于计算所述第一特征和所述第一预测字符的语义特征之间的相似度;
第二生成子模块,用于根据所述第一特征、所述第一预测字符的语义特征和所述相似度,生成第二特征和第三特征,其中,所述第二特征为在所述第一特征的基础上组合了所述第一预测字符的语义特征,所述第三特征为在所述第一预测字符的语义特征的基础上组合了所述第一特征;
所述第二生成子模块,还用于根据所述第二特征和所述第三特征执行识别操作,以生成识别结果。


6.根据权利要求1至3任一项所述的网络,其特征在于,所述文本识别网络还包括特征更新模块,所述特征更新模块,用于:
将所述预设字符的特征与所述第一特征进行组合,以生成更新后的第一特征;
所述识别模块,具体用于根据所述更新后的第一特征和所述第一预测字符的语义特征执行识别操作,以生成与所述待识别图像中的第一字符对应的识别结果。


7.根据权利要求6所述的网络,其特征在于,
所述特征更新模块,具体用于根据所述预设字符的初始特征执行自注意力编码操作,得到所述预设字符的更新后特征,并根据所述第一特征和所述预设字符的更新后特征执行自注意力编码操作,以生成所述更新后的第一特征。


8.根据权利要求1至3任一项所述的网络,其特征在于,
在所述文本识别网络执行识别操作的粒度为字符的情况下,一个第一字符中包括至少一个字符,所述文本识别网络执行一次识别操作输出的一个识别结果中包括一个字符;
在所述文本识别网络执行识别操作的粒度为词语的情况下,一个第一字符中包括至少一个词语,所述文本识别网络执行一次识别操作输出的一个识别结果为包括一个或多个字符的词语。


9.一种文本识别网络的训练方法,其特征在于,所述文本识别网络为用于识别图像中字符的神经网络,所述文本识别网络包括图像特征提取模块、文本特征获取模块和识别模块,所述方法包括:
将待识别图像输入至所述图像特征提取模块,对所述待识别图像进行特征提取,以生成与所述待识别图像中的第一字符对应的第一特征,其中,所述第一字符为所述待识别图像中需要进行识别的字符;
将与所述待识别图像中的第一字符对应的预设字符输入至所述文本特征获取模块,并根据所述预设字符进行文本预测,以生成第一预测字符的语义特征;
根据所述第一特征和所述第一预测字符的语义特征通过所述识别模块执行识别操作,以生成与所述待识别图像中的第一字符对应的识别结果;
根据与所述待识别图像中的第一字符对应的正确结果、识别结果和损失函数,对所述文本识别网络进行训练,所述损失函数指示与所述待识别图像中的第一字符对应的正确结果和与所述待识别图像中的第一字符对应的识别结果之间的相似度。


10.根据权利要求9所述的方法,其特征在于,
所述文本特征获取模块,具体用于在初次对所述待识别图像执行识别操作的情况下,获取与所述待识别图像中的第一字符对应的预设字符,并根据所述预设字符进行文本预测,以生成所述第一预测字符的语义特征;
所述文本特征获取模块,还用于在已对所述第一字符中至少一个字符执行过识别操作的情况下,将与所述第一字符中的已识别字符对应的识别结果确定为第二字符,并根据所述第二字符进行文本预测,以生成与所述第二字符对应的第二预测字符的语义特征。


11.根据权利要求10所述的方法,其特征在于,
所述识别模块,还用于根据所述第一特征和所述第二预测字符的语义特征执行识别操作,以生成与所述待识别图像中的第一字符对应的识别结果。


12.一种文本识别方法,其特征在于,所述方法包括:
将待识别图像输入至图像特征提取模块,对所述待识别图像进行特征提取,以生成与所述待识别图像中的第一字符对应的第一特征,其中,所述第一字符为所述待识别图像中需要进行识别的字符;
将与所述待识别图像中的第一字符对应的预设字符输入至文本特征获取模块,并根据所述第二字符进行文本预测,以生成第一预测字符的语义特征;
根据所述第一特征和所述第一预测字符的语义特征,通过识别模块执行识别操作,以生成与所述待识别图像中的第一字符对应的识别结果;
其中,所述图像特征提取模块、所述文本特征获取模块和所述识别模块归属于同一文本识别网络。


13.根据权利要求12所述的方法,其特征在于,所述将与所述待识别图像中的第一字符对应的预设字符输入...

【专利技术属性】
技术研发人员:刘志广王靓伟
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1