一种文本图像识别方法、系统及相关装置制造方法及图纸

技术编号:37144024 阅读:40 留言:0更新日期:2023-04-06 21:53
本申请公开了一种文本图像识别方法、系统及相关装置,该方法包括:获取包括待识别文字的文本图像,基于所述文本图像获得所述待识别文本对应的初始文字、以及所述初始文字对应的识别置信度得分;基于各个所述初始文字的语义信息,获得各个所述初始文字的语义置信度得分;基于各个所述初始文字对应的所述识别置信度得分和所述语义置信度得分,从所有所述初始文字中确定至少部分待纠正文字;对所述待纠正文字进行纠正,得到所述文本图像对应的目标文本。通过上述方式,本申请能够提高对文本图像进行识别的准确性。进行识别的准确性。进行识别的准确性。

【技术实现步骤摘要】
一种文本图像识别方法、系统及相关装置


[0001]本申请涉及图像识别
,特别是涉及一种文本图像识别方法、系统及相关装置。

技术介绍

[0002]随着自动化办公场景的广泛普及,业界对电子文档的准确性要求越来越高,特别在金融、医疗等领域。现有电子文档以文本和图片格式存储为主,并且不同场景下会经常对这两种文档格式进行相互转换。其中,图片格式转换为文本格式通常采用光学字符识别技术(OCR,Optical Character Recognition)技术实现。
[0003]然而,由于拍摄环境等因素的干扰,容易导致OCR识别的效果较差。传统解决文本误识别的方法多为人工纠错,该方式需要耗费大量人力物力。因此,如何提高图片文本的识别准确性,并对识别出的文本进行检错纠错成为图像文本识别技术的关键。

技术实现思路

[0004]本申请主要解决的技术问题是提供一种文本图像识别方法、系统及相关装置,能够提高对文本图像进行识别的准确性。
[0005]为解决上述技术问题,本申请采用的一个技术方案是:提供一种文本图像识别方法,包括:获取包本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本图像识别方法,其特征在于,包括:获取包括待识别文字的文本图像,基于所述文本图像获得所述待识别文字对应的初始文字、以及所述初始文字对应的识别置信度得分;基于各个所述初始文字的语义信息,获得各个所述初始文字的语义置信度得分;基于各个所述初始文字对应的所述识别置信度得分和所述语义置信度得分,从所有所述初始文字中确定至少部分待纠正文字;对所述待纠正文字进行纠正,得到所述文本图像对应的目标文本。2.根据权利要求1所述的方法,其特征在于,所述基于所述文本图像获得所述待识别文字对应的初始文字、以及所述初始文字对应的识别置信度得分,包括:对所述文本图像进行特征提取以获得所述文本图像中所有所述待识别文字对应的特征序列;对所述特征序列进行编码,以获得各个所述待识别文字对应的第一特征向量;对所述第一特征向量进行特征映射,得到所述第一特征向量对应的第二特征向量;基于所述第一特征向量和所述第二特征向量,获得所述初始文字、以及所述初始文字对应的识别置信度得分。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一特征向量和所述第二特征向量,获得所述初始文字、以及所述初始文字对应的识别置信度得分,包括:对所述第一特征向量进行解码,以获得解码向量;将所述第一特征向量与其对应的所述第二特征向量的乘积进行归一化,得到权重矩阵;基于注意力机制,将所述权重矩阵与对应所述解码向量相乘并进行归一化,得到所述待识别文字对应的所述初始文字、以及所述初始文字的识别置信度得分。4.根据权利要求1所述的方法,其特征在于,所述基于各个所述初始文字的语义信息,获得各个所述初始文字的语义置信度得分,包括:基于各个所述待识别文字在所述文本图像中的位置信息,对所有所述初始文字进行排列,以获得所述文本图像对应的识别文本;基于所述识别文本的文本语义信息,获得所述识别文本中各个所述初始文字的语义置信度得分。5.根据权利要求1所述的方法,其特征在于,所述基于各个所述初始文字对应的所述识别置信度得分和所述语义置信度得分,从所有所述初始文字中确定至少部分待纠正文字,包括:基于各个所述初始文字对应的识别置信度得分获得第一高斯分布模型;以及基于各个所述初始文字对应的语义置信度得分获得第二高斯分布模型;分别对所述第一高斯分布模型和所述第二高斯分布模型分布设置相应的权重,并基于所述第一高斯分布模型及其对应的权重和所述第二高斯分布模型及其对应的权重,获得混合高斯分布模型;针对所述混合高斯分布模型,将小于门限值的数值对应的所述初始文字作为所述待纠正文字;其...

【专利技术属性】
技术研发人员:刘宇何春江张毅朱日伟
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1