一种文本识别方法、模型训练方法、装置及设备制造方法及图纸

技术编号:26304882 阅读:35 留言:0更新日期:2020-11-10 20:01
本说明书实施例提供一种文本识别方法、模型训练方法、装置及设备。所述方法包括:接收待处理图像;所述待处理图像中包含有待识别文本;获取所述待处理图像对应的图像模板类别;在所述待处理图像中截取出对应于所述图像模板类别的待处理模板图像;确定对应于所述待处理模板图像的倾斜角度;基于所述倾斜角度对所述待处理模板图像中的待识别文本进行识别。通过上述方法,通过确定对应于一定图像模板类别的待处理模板图像,进而识别出待处理模板图像的倾斜角度,从而能够基于倾斜角度对图像进行矫正并进一步实现图像中的文本的识别,解决了无法准确识别倾斜图像中的文本的问题。

【技术实现步骤摘要】
一种文本识别方法、模型训练方法、装置及设备
本说明书实施例涉及计算机
,特别涉及一种文本识别方法、模型训练方法、装置及设备。
技术介绍
随着科技的进步和社会的发展,在工作和生活中越来越多地利用到对图像中的文字进行识别。对图像中的文字进行识别时,首先获取图像中的字符,并基于所识别的字符构建完整的字段。但是,在实际应用中,所获取到的图像可能是具有一定倾斜角度的倾斜图像,直接对倾斜图像中的文字进行识别不仅在字符识别上具有一定的难度,也可能无法根据倾斜的文本构建正确的段落,从而无法对图像中的文本进行准确识别。因此,目前亟需一种能够对倾斜图像中的文本进行识别的技术方案。
技术实现思路
本说明书实施例的目的是提供一种文本识别方法、模型训练方法、装置及设备,以解决如何对倾斜图像中的文本进行识别的问题。为解决上述技术问题,本申请实施例还提供一种图像识别模型训练方法,包括:接收第一样本图像;所述第一样本图像对应有图像模板类别;所述样本图像中标注有至少一个第一定位字符;获取所述第一定位字符在所述第一样本图像本文档来自技高网...

【技术保护点】
1.一种文本识别方法,其特征在于,包括:/n接收待处理图像;所述待处理图像中包含有待识别文本;/n获取所述待处理图像对应的图像模板类别;/n在所述待处理图像中截取出对应于所述图像模板类别的待处理模板图像;/n确定对应于所述待处理模板图像的倾斜角度;/n基于所述倾斜角度对所述待处理模板图像中的待识别文本进行识别。/n

【技术特征摘要】
1.一种文本识别方法,其特征在于,包括:
接收待处理图像;所述待处理图像中包含有待识别文本;
获取所述待处理图像对应的图像模板类别;
在所述待处理图像中截取出对应于所述图像模板类别的待处理模板图像;
确定对应于所述待处理模板图像的倾斜角度;
基于所述倾斜角度对所述待处理模板图像中的待识别文本进行识别。


2.如权利要求1所述的方法,其特征在于,所述待处理图像中包含有身份证图像;相应的,所述图像模板类别包括身份证图像正面模板和身份证图像背面模板。


3.如权利要求1所述的方法,其特征在于,所述获取所述待处理图像对应的图像模板类别,包括:
将所述待处理图像输入图像识别模型以获取所述待处理图像对应的图像模板类别;所述图像识别模型用于识别图像所对应的图像模板类别。


4.如权利要求1所述的方法,其特征在于,所述确定对应于所述待处理模板图像的倾斜角度,包括:
将所述待处理模板图像输入角度识别模型以得到所述待处理模板图像对应的倾斜角度;所述角度识别模型,用于识别图像的倾斜角度。


5.如权利要求4所述的方法,其特征在于,所述将所述待处理模板图像输入角度识别模型以得到所述待处理模板图像对应的倾斜角度,包括:
将所述待处理模板图像进行卷积得到对应于所述待处理模板图像的图像特征;
将所述图像特征进行降维;
基于降维后的图像特征计算对应于待处理模板图像的输出值;
利用所述输出值获取所述待处理模板图像对应的倾斜角度。


6.如权利要求1所述的方法,其特征在于,所述基于所述倾斜角度对所述待处理图像中的待识别文本进行识别,包括:
基于所述倾斜角度对所述待处理图像进行旋转;
对旋转后的待处理模板图像中的待识别文本进行识别。


7.一种文本识别装置,其特征在于,包括:
待处理图像接收模块,用于接收待处理图像;所述待处理图像中包含有待识别文本;
图像模板类别获取模块,用于获取所述待处理图像对应的图像模板类别;
待处理模板图像截取模块,用于在所述待处理图像中截取出对应于所述图像模板类别的待处理模板图像;
倾斜角度确定模块,用于确定对应于所述待处理模板图像的倾斜角度;
文本识别模块,用于基于所述倾斜角度对所述待处理模板图像中的待识别文本进行识别。


8.一种文本识别设备,包括存储器和处理器;
所述存储器,用于存储计算机程序指令;
所述处理器,用于执行所述计算机程序指令以实现以下步骤:接收待处理图像;所述待处理图像中包含有待识别文本;获取所述待处理图像对应的图像模板类别;在所述待处理图像中截取出对应于所述图像模板类别的待处理模板图像;确定对应于所述待处理模板图像的倾斜角度;基于所述倾斜角度对所述待处理模板图像中的待识别文本进行识别。


9.一种图像识别模型训练方法,其特征在于,包括:
接收第一样本图像;所述第一样本图像对应有图像模板类别;所述样本图像中标注有至少一个第一定位字符;
获取所述第一定位字符在所述第一样本图像中的字符位置;
基于所述字符位置和所述图像模块类别训练预先构建的图像识别模型;所述图像识别模型,用于识别图像所对应的图像模板类别。


10.如权利要求9所述的方法,其特征在于,所述第一样本图像包括以下至少一种:证件图像、标识牌照片、终端设备屏幕截图。


11.如权利要求9所述的方法,其特征在于,所述获取所述第一定位字符在所述...

【专利技术属性】
技术研发人员:谢小容张晓丹孙歌睿
申请(专利权)人:中国建设银行股份有限公司建信金融科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1