当前位置: 首页 > 专利查询>湖南大学专利>正文

文本识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:34014781 阅读:26 留言:0更新日期:2022-07-02 15:29
本申请涉及一种上述文本识别方法、装置、计算机设备、存储介质和计算机程序产品,其中,方法包括:获取文本图像;提取文本图像的字符特征,生成文本图像特征序列;获取文本图像特征序列的邻域信息,并将邻域信息与文本图像特征序列融合,得到融合的文本图像特征序列;提取、并结合融合的文本图像特征序列的多时序上下文关系,得到目标文本图像特征序列;根据目标文本图像特征序列,得到文本识别结果。整个过程中,基于文本图像的图像特征获取领域信息以及多时序上下文关系,再基于领域信息以及多时序上下文关系来进行文本识别,增强了语义特征,显著提高了文本识别的准确度,可以实现准确的文本识别。确的文本识别。确的文本识别。

【技术实现步骤摘要】
文本识别方法、装置、计算机设备及存储介质


[0001]本申请涉及文本识别
,特别是涉及一种文本识别方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]文本识别是人工智能领域的一项重要任务,其中手写文本的识别是最具挑战性的。虽然科技发展迅速,但手写活动仍然更容易,更有效,更便宜。许多重要的文件仍然需要手工填写和数字化,包括办公室手写文件处理、邮寄地址识别和珍贵的历史手稿识别。手写汉字文本图像的自动识别是困难的,因为涉及多种书写风格、复杂的字符结构和大量的字符类别。因此,对手写汉字文本的识别算法的研究意义重大且极具应用前景。
[0003]随着深度学习技术的兴起和普及,利用神经网络解决手写汉字文本的问题受到越来越多的关注,也取得非常大的成功。最近流行的技术解决方案是将文本识别视为图像序列建模任务,卷积循环神经网络是目前应用最广泛的方法,其中卷积神经网络作为特征提取器,而循环神经网络则学习长期依赖关系。
[0004]虽然传统基于卷积循环神经网络进行文本识别的方案可以实现文本的识别,但是也存在识别准确率不高的缺本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法,其特征在于,所述方法包括:获取文本图像;提取所述文本图像的字符特征,生成文本图像特征序列;获取文本图像特征序列的邻域信息,并将所述邻域信息与所述文本图像特征序列融合,得到融合的文本图像特征序列;提取、并结合所述融合的文本图像特征序列的多时序上下文关系,得到目标文本图像特征序列;根据所述目标文本图像特征序列,得到文本识别结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述目标文本图像特征序列,得到文本识别结果包括:将所述目标文本图像特征序列输入至卷积神经网络进行文本分类预测,得到字符以及所述字符对应的预测概率;根据所述字符以及所述字符对应的预测概率,得到不同字符序列的概率分布;选取概率最大对应的字符序列,得到文本识别结果。3.根据权利要求2所述的方法,其特征在于,所述根据所述字符以及所述字符对应的预测概率,得到不同字符序列的概率分布包括:根据所述字符以及所述字符对应的预测概率,通过CTC得到不同字符序列的概率分布。4.根据权利要求1所述的方法,其特征在于,所述提取所述文本图像的字符特征,生成文本图像特征序列之前,还包括:对所述文本图像进行尺寸归一化处理,以更新所述文本图像。5.根据权利要求1所述的方法,其特征在于,所述提取所述文本图像的字符特征,生成文本图像特征序列包括:通过残差卷积网络提取所述文本图像的字符特征,生成文本图像特征序列,所述残差卷积网络中每个残差模块之后连接有卷积层。6.根据权利要求1所述的方法,其特...

【专利技术属性】
技术研发人员:谭怀亮陈淑玉贺再红谭彦杰
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1