文本识别方法和相关产品技术

技术编号:23213272 阅读:33 留言:0更新日期:2020-01-31 22:02
本申请实施例公开了一种文本识别方法和相关产品,该方法通过文本识别网络实现,其中,所述文本识别网络包括编码网络和第二解码网络,所述方法包括:通过所述编码网络对目标图像进行编码处理,得到第一特征序列;通过所述第二解码网络对所述第一特征序列进行解码处理,得到第二特征序列;基于所述第二特征序列,得到文本识别结果;其中,所述编码网络是通过对包括所述编码网络和不同于所述第二解码网络的第一解码网络的第一识别网络进行训练得到的,所述第二解码网络是通过对包括所述编码网络和所述第二解码网络的第二识别网络进行训练得到的;可以在保证文本识别速度的情况下,提高文本识别精度。

Text recognition methods and related products

【技术实现步骤摘要】
文本识别方法和相关产品
本申请涉及文本识别领域,尤其涉及一种文本识别方法和相关产品。
技术介绍
利用计算机视觉技术进行文本识别广泛应用于多个领域,在目前针对真实场景下的文本识别技术中,识别速度和识别精度无法同时满足,需要研究能够同时具有较好的识别速度以及识别精度的文本识别方法。
技术实现思路
本申请实施例公开了一种文本识别方法和相关产品。第一方面,本申请实施例提供了一种文本识别方法,通过文本识别网络实现,其中,所述文本识别网络包括编码网络和第二解码网络,该方法可包括:通过所述编码网络对目标图像进行编码处理,得到第一特征序列;通过所述第二解码网络对所述第一特征序列进行解码处理,得到第二特征序列;基于所述第二特征序列,得到文本识别结果;其中,所述编码网络是通过对包括所述编码网络和不同于所述第二解码网络的第一解码网络的第一识别网络进行训练得到的,所述第二解码网络是通过对包括所述编码网络和所述第二解码网络的第二识别网络进行训练得到的。本申请实施例的执行主体为文本识别装置。该文本识别装置可以是手机、平板电脑等终端设备,本文档来自技高网...

【技术保护点】
1.一种文本识别方法,其特征在于,通过文本识别网络实现,其中,所述文本识别网络包括编码网络和第二解码网络,所述方法包括:/n通过所述编码网络对目标图像进行编码处理,得到第一特征序列;/n通过所述第二解码网络对所述第一特征序列进行解码处理,得到第二特征序列;/n基于所述第二特征序列,得到文本识别结果;其中,/n所述编码网络是通过对包括所述编码网络和不同于所述第二解码网络的第一解码网络的第一识别网络进行训练得到的,/n所述第二解码网络是通过对包括所述编码网络和所述第二解码网络的第二识别网络进行训练得到的。/n

【技术特征摘要】
1.一种文本识别方法,其特征在于,通过文本识别网络实现,其中,所述文本识别网络包括编码网络和第二解码网络,所述方法包括:
通过所述编码网络对目标图像进行编码处理,得到第一特征序列;
通过所述第二解码网络对所述第一特征序列进行解码处理,得到第二特征序列;
基于所述第二特征序列,得到文本识别结果;其中,
所述编码网络是通过对包括所述编码网络和不同于所述第二解码网络的第一解码网络的第一识别网络进行训练得到的,
所述第二解码网络是通过对包括所述编码网络和所述第二解码网络的第二识别网络进行训练得到的。


2.根据权利要求1所述的方法,其特征在于,所述编码网络的参数在训练所述第二识别网络的过程中保持不变。


3.根据权利要求1或2所述的方法,其特征在于,所述文本识别网络还包括矫正网络,在所述通过所述解码网络对目标图像进行编码处理,得到第一特征序列之前,还包括:
通过所述矫正网络对原始图像进行矫正处理,得到所述目标图像,其中,所述矫正网络是通过对包括所述矫正网络、所述编码网络和所述第一编码网络的所述第一识别网络进行训练得到的。


4.一种文本识别方法,其特征在于,包括:
对目标图像进行编码处理,得到第一特征序列,其中,所述第一特征序列包括多个特征切片;
对所述第一特征序列中的多个特征切片进行融合处理,得到融合特征序列;
基于所述融合特征序列中多个特征切片之间的上下文信息,对所述融合特征序列进行处理,得到第二特征序列;
基于所述第二特征序列,得到文本识别结果。


5.一种文本识别网络的训练方法,其特征在于,所述文本识别网络在第一解码网络的协助下进行训练,所述文本识别网络包括编码网络和第二解码网络,所述编码网络的输出端分别与所述第一解码网络和所述第二解码网络的输入端连接,所述方法包括:
基于通过所述编码网络和所述第一解码网络对第一训练样本依次进行处理所得到的处理结果,得到第一网络损失;
利用第一网络损失更新所述编码网络和所述第一解码网络的网络参数,得到参数更新后的所述编码网络;
基于通过所述参数更新后的编码网络和所述第二解码网络对第二训练样本依次进行处理所得到的处理结果,得到第二网络损失;
利用所述第二网络损失更新所述第二解码网络的参数,得到参数更新后的所述第二解码网络。


6.一种文本识别装置,其特征在于,...

【专利技术属性】
技术研发人员:蔡晓聪侯军伊帅
申请(专利权)人:北京市商汤科技开发有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1