【技术实现步骤摘要】
字符识别方法、装置、设备及可读存储介质
本申请涉及信息处理
,更具体地说,涉及一种字符识别方法、装置、设备及可读存储介质。
技术介绍
光学字符识别(OpticalCharacterRecognition,简称OCR)是计算机视觉的子方向,目标是从图像数据中识别出文字,并保存为计算机文本数据。目前,多采用基于循环神经网络(如长短期记忆网络LSTM,或双向LSTM)的识别模型进行字符识别,但基于循环神经网络的识别模型在训练过程中很难收敛,也很难进行并行计算,而且由于数据量和运算量比较大,在后期的实际部署过程也比较困苦。另外,目前的字符识别方法的识别精度较低,易出现多字、漏字、错字等问题。因此,有必要提供一种字符识别方法,以至少部分的克服现有的字符识别方法存在的缺陷。
技术实现思路
有鉴于此,本申请提供了一种字符识别方法、装置、设备及可读存储介质,以至少部分的克服现有的字符识别方法存在的缺陷。为了实现上述目的,现提出的方案如下:一种字符识别方法,包括:获得图像,所述 ...
【技术保护点】
1.一种字符识别方法,其特征在于,包括:/n获得图像,所述图像中具有待识别的字符;/n按照字符的排列方向,将所述图像裁剪为若干字符条,每个字符条中具有一排字符;/n对于每一个字符条,利用预先训练好的全卷积网络识别模型处理该字符条,得到该字符条的字符识别结果,所述全卷积网络识别模型至少被配置为:接收输入的字符条,获取所述输入的字符条的特征图,对所述特征图进行变形处理,以获得所述输入的字符条的携带上下文信息的特征序列,并根据所述特征序列预测所述输入的字符条中的各个字符;所述特征序列中的不同元素为所述字符条中不同区域的特征表示。/n
【技术特征摘要】
1.一种字符识别方法,其特征在于,包括:
获得图像,所述图像中具有待识别的字符;
按照字符的排列方向,将所述图像裁剪为若干字符条,每个字符条中具有一排字符;
对于每一个字符条,利用预先训练好的全卷积网络识别模型处理该字符条,得到该字符条的字符识别结果,所述全卷积网络识别模型至少被配置为:接收输入的字符条,获取所述输入的字符条的特征图,对所述特征图进行变形处理,以获得所述输入的字符条的携带上下文信息的特征序列,并根据所述特征序列预测所述输入的字符条中的各个字符;所述特征序列中的不同元素为所述字符条中不同区域的特征表示。
2.根据权利要求1所述的方法,其特征在于,所述获取所述输入的字符条的特征图,包括:
获取所述输入的字符条的初始特征图;
利用特征提取块对所述初始特征图进行特征提取,得到所述输入的字符条的特征图;其中,所述特征提取块由至少两个子特征提取块级联构成,每个子特征提取块被配置为:
对输入该子特征提取块的特征图进行稠密卷积处理,得到第一中间特征图;
对所述第一中间特征图进行前景增强处理,得到第二中间特征图;
最后一级子特征提取块输出的第二中间特征图为所述输入的字符条的特征图。
3.根据权利要求2所述的方法,其特征在于,所述对所述第一中间特征图进行前景增强处理,包括:
基于残差注意力机制对所述第一中间特征图进行前景增强处理。
4.根据权利要求3所述的方法,其特征在于,所述基于残差注意力机制对所述第一中间特征图进行前景增强处理,包括:
对所述第一中间特征图进行特征提取,得到第三中间特征图;
基于所述第三中间特征图计算所述第三中间特征图中各个元素的权重;
将所述第三中间特征图中的各个元素乘以对应的权重,所得的结果与所述第三中间特征图相加,得到并输出第二中间特征图。
5.根据权利要求1所述的方法,其特征在于,所述对所述特征图进行变形处理,包括:
将所述特征图变形为初始特征序列,所述初始特征序列中元素的个数为所述特征图的高度和宽度的乘积,所述初始特征序列中每个元素是长度为所述特征图的通道数的向量;
将所述初始特征序列中的各个元素组合得到第四中间特征图,所述第四中间特征图的通道数为1,高度为所述特征图的通道数,宽度为所述初始特征序列中元素的个数;
对所述第四中间特征图进行卷积处理,得到第五中间特征图;
将所述第五中间特征图变形,得到所述输入...
【专利技术属性】
技术研发人员:韩涛,李梓赫,毛钺铖,王丹,王光新,谭昶,
申请(专利权)人:讯飞智元信息科技有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。