图像文本识别方法、装置、设备及计算机存储介质制造方法及图纸

技术编号：24355407 阅读：48 留言：0更新日期：2020-06-03 02:27

本发明专利技术公开了一种图像文本识别方法、装置、设备及计算机存储介质。其中，图像文本识别方法包括：利用卷积神经网络提取目标图像的空间特征；利用长短期记忆网络根据空间特征提取目标图像的时序特征；根据空间特征和时序特征，确定目标图像中的至少一个文本区域；识别文本区域中的文本信息。根据本发明专利技术实施例，能够快速、准确地识别目标图像中的不规则的图像文本，提高图像文本识别的性能。

Image text recognition method, device, equipment and computer storage medium

全部详细技术资料下载

【技术实现步骤摘要】
图像文本识别方法、装置、设备及计算机存储介质
本专利技术属于图像处理
，尤其涉及一种图像文本识别方法、装置、设备及计算机存储介质。
技术介绍
随着图像文本识别技术的应用越来越广泛，人们对图像中文本识别的性能需求不断提升，现有的图像文本的识别方法已经不能满足人们对图像文本识别性能的需求。目前的图像文本的识别方法包括：模板匹配法、几何特征抽取法和利用卷积神经网络(CNN)提取图片特征的方法，目前的图像文本的识别方法包括：模板匹配法是通过将输入的文字与给定的各类别标准文字(模板)进行相关匹配，计算输入文字与各模板之间的相似性程度，取相似度最大的类别作为识别结果来进行图像文本的识别。由于这种识别方法利用整个文字进行相似度计算，因此，对文字的缺损、边缘噪声等具有较强的适应能力。但是，在使用这种识别方法时，当被识别文字的类别增加时，模板的数量也随之增加，不但会增加文本识别设备的存储容量，还会降低文本识别的正确率。因此，这种识别方法仅适用于识别固定字型的印刷体文字。几何特征抽取法是通过抽取文字的一些几何特征，如文字的端点、分叉点、凹凸部分以及水平、垂直、倾斜等各方向的线段、闭合环路等，根据这些几何特征的位置和相互关系进行逻辑组合判断来进行图像文本的识别。这种识别方法由于利用文字的几何特征对应的结构信息进行图像文本的识别，也可以适用于手写体文字等变型较大的文字。利用CNN提取图片特征的方法，首先采用CNN先对文字库进行训练，设定CNN各参数，然后输入待测试图片，将图片分割成一个个微型区域进行特征...

【技术保护点】
1.一种图像文本识别方法，其特征在于，包括：/n利用卷积神经网络提取目标图像的空间特征；/n利用长短期记忆网络根据所述空间特征提取所述目标图像的时序特征；/n根据所述空间特征和所述时序特征，确定所述目标图像中的至少一个文本区域；/n识别所述文本区域中的文本信息。/n

【技术特征摘要】
1.一种图像文本识别方法，其特征在于，包括：
利用卷积神经网络提取目标图像的空间特征；
利用长短期记忆网络根据所述空间特征提取所述目标图像的时序特征；
根据所述空间特征和所述时序特征，确定所述目标图像中的至少一个文本区域；
识别所述文本区域中的文本信息。

2.根据权利要求1所述的图像文本识别方法，其特征在于，利用卷积神经网络提取目标图像的空间特征包括：
将所述目标图像分别输入多个具有不同卷积核的三层卷积层，并分别输出与多个所述三层卷积层对应的多个特征图；
根据所述多个特征图，确定所述目标图像的空间特征。

3.根据权利要求2所述的图像文本识别方法，其特征在于，根据所述多个特征图，确定所述目标图像的空间特征包括：
融合所述多个特征图，获得具有第一维度顺序的融合特征图；
利用预定尺寸的滑动窗口对所述融合特征图进行提取，获得所述空间特征。

4.根据权利要求1所述的图像文本识别方法，其特征在于，所述长短期记忆网络为嵌套长短期记忆网络，利用长短期记忆网络根据所述空间特征提取所述目标图像的时序特征包括：
将所述空间特征输入至所述嵌套长短期记忆网络，获取所述嵌套长短期记忆网络中各层长短期记忆网络对应的多个输出数据；
根据所述多个输出数据，确定所述目标图像的时序特征。

5.根据权利要求4所述的图像文本识别方法，其特征在于，根据所述多个输出数据，确定所述目标图像的时序特征包括：
融合所述多个输出数据，获得具有第二维度顺序的特征数据；
...

【专利技术属性】
技术研发人员：王伟豪，
申请(专利权)人：中国移动通信集团辽宁有限公司，中国移动通信集团有限公司，
类型：发明
国别省市：辽宁;21

全部详细技术资料下载我是这个专利的主人