文本识别方法、装置、可读介质及电子设备制造方法及图纸

技术编号:32189980 阅读:34 留言:0更新日期:2022-02-08 15:54
本公开涉及一种文本识别方法、装置、可读介质及电子设备,所述方法包括:获取待识别的文本图像中每个字符对应的热力图;根据多个所述热力图,对所述文本图像进行第一下采样处理,得到所述文本图像对应的特征图像;根据所述特征图像,获取所述文本图像对应的文本内容。也就是说,本公开可以根据待识别的文本图像中的每个字符对应的热力图,对该文本图像进行第一下采样处理,这样,可以避免对该文本图像的宽或高进行过度压缩,使得根据第一下采样处理后得到的特征图像获取的文本内容更加准确,从而提高了文本图像识别的准确率。从而提高了文本图像识别的准确率。从而提高了文本图像识别的准确率。

【技术实现步骤摘要】
文本识别方法、装置、可读介质及电子设备


[0001]本公开涉及图像处理
,具体地,涉及一种文本识别方法、装置、可读介质及电子设备。

技术介绍

[0002]随着文本图像识别技术的广泛应用,人们对文本图像识别的准确率的要求越来越高,需要能够准确识别文本图像中的每个字符。相关技术中,通过基于深度学习的神经网络模型识别文本图像中的文本内容。
[0003]但是,针对部分比较复杂的文本图像,例如广告、电影海报等文本图像,文本图像中的标题往往会使用特殊排版,这样,通过同一个神经网络模型对该文本图像进行识别时,会导致部分字符无法正常识别,从而使得文本图像识别的准确率比较低。

技术实现思路

[0004]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0005]第一方面,本公开提供一种文本识别方法,所述方法包括:
[0006]获取待识别的文本图像中每个字符本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法,其特征在于,所述方法包括:获取待识别的文本图像中每个字符对应的热力图;根据多个所述热力图,对所述文本图像进行第一下采样处理,得到所述文本图像对应的特征图像;根据所述特征图像,获取所述文本图像对应的文本内容。2.根据权利要求1所述的方法,其特征在于,所述获取待识别的文本图像中每个字符对应的热力图包括:将待识别的所述文本图像输入预先训练的热力图获取模型,输出所述文本图像中每个字符对应的热力图。3.根据权利要求2所述的方法,其特征在于,所述热力图获取模型通过以下方式训练得到:获取样本集,所述样本集包括多个样本图像,以及所述样本图像中每个字符对应的字符区域;通过所述样本集对目标神经网络模型进行训练,得到所述热力图获取模型。4.根据权利要求1所述的方法,其特征在于,所述根据多个所述热力图,对所述文本图像进行第一下采样处理,得到所述文本图像对应的特征图像包括:根据多个所述热力图,确定所述文本图像对应的复杂度;根据所述文本图像的复杂度,对所述文本图像进行所述第一下采样处理,得到所述文本图像对应的特征图像。5.根据权利要求4所述的方法,其特征在于,所述根据所述文本图像的复杂度,对所述文本图像进行所述第一下采样处理,得到所述文本图像对应的特征图像包括:确定所述文本图像的复杂度与预设复杂度阈值之间的差值;根据所述差值,从预先训练的多个下采样模型中确定目标下采样模型,不同的下采样模型对应不同的下采样倍率;通过所述目标下采样模型对所述文本图像进行所述第一下采样处理,得到所述文本图像对应的特征图像。6.根据...

【专利技术属性】
技术研发人员:蔡悦黄灿王长虎
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1