【技术实现步骤摘要】
一种文本识别方法、装置、设备及存储介质
本申请涉及图像处理
,尤其涉及一种文本识别方法、装置、设备及存储介质。
技术介绍
光学字符识别(OpticalCharacterRecognition,简称OCR)是计算机视觉的一个研究分支,其目标是从图像数据中识别出字符,并保存为计算机文本数据。传统的光学字符识别方法通常是先从图像中检测字符位置,然后对各个字符位置进行字符识别,确定图像中所包含的字符。当图像内容复杂时,传统的光学字符识别方法通常无法准确地识别出图像中的字符内容,例如对自然场景图像进行字符识别时,由于图像内容排布不规则,经常出现识别结果多字或少字的现象。
技术实现思路
基于上述技术现状,本申请提出一种文本识别方法、装置、设备及存储介质,能够以更高的准确度识别图像文本。一种文本识别方法,包括:获取待识别图像的图像特征,其中,所述图像特征为,能够以其为依据预测所述待识别图像中包含的字符信息的图像特征,所述字符信息包括字符种类,以及各种类字符在所述待识别图像中出现的次数;利用所述图像特征进行文本识别处理,得到对所述待识别图像的文本识别结果。一种文本识别装置,包括:特征获取单元,用于获取待识别图像的图像特征,其中,所述图像特征为,能够以其为依据预测所述待识别图像中包含的字符信息的图像特征,所述字符信息包括字符种类,以及各种类字符在所述待识别图像中出现的次数;文本识别单元,用于利用所述图像特征进行文本识别处理,得到对所述待识别图像的文本识别 ...
【技术保护点】
1.一种文本识别方法,其特征在于,包括:/n获取待识别图像的图像特征,其中,所述图像特征为,能够以其为依据预测所述待识别图像中包含的字符信息的图像特征,所述字符信息包括字符种类,以及各种类字符在所述待识别图像中出现的次数;/n利用所述图像特征进行文本识别处理,得到对所述待识别图像的文本识别结果。/n
【技术特征摘要】
1.一种文本识别方法,其特征在于,包括:
获取待识别图像的图像特征,其中,所述图像特征为,能够以其为依据预测所述待识别图像中包含的字符信息的图像特征,所述字符信息包括字符种类,以及各种类字符在所述待识别图像中出现的次数;
利用所述图像特征进行文本识别处理,得到对所述待识别图像的文本识别结果。
2.根据权利要求1所述的方法,其特征在于,获取待识别图像的图像特征,以及利用所述图像特征进行文本识别处理,得到对所述待识别图像的文本识别结果,包括:
将待识别图像输入预先训练的文本识别模型,得到对所述待识别图像的文本识别结果;
所述文本识别模型具备获取所述待识别图像的图像特征,并利用所述图像特征进行文本识别处理,得到对所述待识别图像的文本识别结果的能力;其中,所述文本识别模型获取的所述待识别图像的图像特征为,能够以其为依据预测所述待识别图像中包含的字符信息的图像特征。
3.根据权利要求2所述的方法,其特征在于,所述文本识别模型包括:
预处理模块,用于对所述待识别图像进行预处理,所述预处理包括图像矫正处理;
特征提取模块,用于提取预处理后的所述待识别图像的图像特征;其中,所述特征提取模块提取的预处理后的所述待识别图像的图像特征为,能够以其为依据预测所述待识别图像中包含的字符信息的图像特征;
特征处理模块,用于对所述待识别图像的图像特征进行序列转换及卷积处理;
文本识别模块,用于利用所述特征处理模块处理后的图像特征进行文本识别处理,得到对所述待识别图像的文本识别结果。
4.根据权利要求2所述的方法,其特征在于,所述文本识别模型的训练过程,包括:
获取图像样本的图像特征;
利用所述图像样本的图像特征进行文本识别处理,得到对所述图像样本的文本识别结果,以及,利用所述图像样本的图像特征,识别所述图像样本中包含的字符信息;
以识别到的字符信息趋近于所述图像样本的字符信息标签,以及,对所述图像样本的文本识别结果趋近于所述图像样本的文本标注标签为目标,对所述文本识别模型的运算参数进行更新;
其中,所述文本识别模型利用所述图像样本的图像特征进行文本识别处理,以及识别所述图像样本中包含的字符信息的过程中,将所述图像样本的高池化到设定高度,以便能够从任意形态的图像样本中识别文本信息,和/或识别所述图像样本中的任意方向的文本信息。
5.根据权利要求4所述的方法,其特征在于,所述获取图像样本的图像特征,包括:
利用所述文本识别模型中的特征提取模块获取所述图像样本的图像特征;
所述对所述文本识别模型的运算参数进行更新,包括:
对所述文本识别模型中的特征提取模块的运算参数进行更新。
6.根据权利要求4所述的方法,其特征在于,所述利用所述图像样本的图像特征,识别所述图像样本中包含的字符信息,包括:
根据所述图像样本的图像特征,分别确定对应每个图像特征序列元...
【专利技术属性】
技术研发人员:韩涛,李梓赫,谭昶,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。