一种文字识别方法、装置、设备及介质制造方法及图纸

技术编号:30050275 阅读:15 留言:0更新日期:2021-09-15 10:52
本申请适用于文字识别技术领域,提供了一种文字识别方法、装置、计算机设备及计算机可读介质,其中,一种文字识别方法,对图像中曲形排列的文字内容进行文字定位,得到每个文字所对应的文字定位框,根据每个文字定位框的中线与水平方向的夹角,对每个文字进行旋转操作,得到正向文字内容,根据正向文字的外接矩形,调整正向文字的大小,得到调整后的文字,将调整后的文字按照原始的顺序排列在水平直线上得到待识别文本内容,最后采用现有的文字识别模型对重新排列的待识别文本内容进行识别,提高了现有的文字识别模型对曲形排列文字识别的适用性和识别效果,减少了人工干预,进一步提升了对曲形文字识别的效率。提升了对曲形文字识别的效率。提升了对曲形文字识别的效率。

【技术实现步骤摘要】
一种文字识别方法、装置、设备及介质


[0001]本申请属于图像处理、文字识别
,特别涉及一种文字识别方法、 装置、设备及介质。

技术介绍

[0002]在文字识别过程中,曲形排列的文字中经常包含着一些关键的信息,如图 1和图2所示的场景,因此需要对曲形排列的文字进行识别,但现有的文字识 别模型主要是针对水平排列的文字区域进行识别的,对于曲形排列文字的识别 效果明显劣于对按水平直线排列的文字的识别效果。随着文字定位算法的进步, 现已经能够对曲形排列的文字区域的特定部位进行很好的定位,然而,由于现 有的文字识别模型对曲形文字的识别效果不佳,在定位出曲形排列的文字区域 后往往还需要借助人工来对文字进行识别分拣,这种对曲形文字的识别方法显 然是枯燥和效率低下的,且在对实时性要求较高的业务中会造成很大的不便。 因此需要提供一种能够对曲形文本区域进行定位和处理,使处理后的曲形文本 中的文字能够被现有的文字识别模型很好的识别,从而改善现有的文字识别模 型对于曲形排列的文字识别效果不佳的方法。

技术实现思路

[0003]有鉴于此,本申请实施例提供了一种文字识别方法、装置及计算机设备, 以解决现有技术在曲形排列的文字进行识别时效果不佳的问题。
[0004]本申请实施例一方面提供一种文字识别方法,包括:
[0005]对图像中曲形排列的文字内容进行文字定位,得到每个文字所对应的文字 定位框;
[0006]根据每个所述文字定位框的中线与水平方向的夹角,对每个所述文字进行 旋转操作,得到正向文字内容
[0007]根据所述正向文字内容中的每个文字的外接矩形,调整所述正向文字内容 中的文字的大小,得到调整后的文字;
[0008]根据所述曲形排列的文字内容中的所述文字定位框之间的位置关系,将所 述调整后的文字排列在一条水平直线上,得到待识别文本内容;
[0009]对所述待识别文本内容进行文字识别,得到文本识别结果。
[0010]本申请实施例第二方面提供了一种文字识别别装置,包括:
[0011]文本定位模块,用于对图像中曲形排列的文字内容进行文字定位,得到每 个文字所对应的文字定位框;
[0012]文字转正模块,用于根据每个所述文字定位框的中线与水平方向的夹角, 对每个所述文字进行旋转操作,得到正向文字内容;
[0013]文字调整模块,用于根据所述正向文字内容中的每个文字的外接矩形,调 整所述正向文字内容中的文字的大小,得到调整后的文字;
[0014]文字排列模块,用于根据所述曲形排列的文字内容中的所述文字定位框之 间的位置关系,将所述调整后的文字排列在一条水平直线上,得到待识别文本 内容;
[0015]文字识别模块,用于对所述待识别文本内容进行文字识别,得到文本识别 结果。
[0016]本申请实施例第三方面提供了一种计算机设备,包括存储器、处理器以及 存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行 所述计算机程序时实现第一方案提供的文字识别方法。
[0017]本申请实施例第四方面提供了一种计算机可读存储介质,所述计算机可读 存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方案提 供的所述的文字识别方法。
[0018]实施本申请实施例提供的一种文字识别方法、文字识别装置、计算机设备 及计算机可读存储介质具有以下有益效果:
[0019]本申请实施例提供的文字识别方法,首先对曲形文字区域进行识别定位, 得到每个文字所对应的文字定位框,然后根据每个文字定位框竖直方向中线的 倾斜程度将每个文字定位框转正得到正向文字内容,根据每个正向文字的外接 矩形的高来调整对应文字的大小得到调整后的文字,将调整后的文字按照定位 框排序表的顺序进行排列得到拉待识别文本内容,之后就可以利用通用的文字 识别模型对待识别文本内容进行识别得到最终的文本识别结果。本申请实施例 提供的文字识别方法,将曲形文字转正拉直然后再识别,提高了现有的文字识 别模型对于曲形排列文字识别的适用性和识别效果,同时减少了人工干预,提 升了现有文字识别模型对曲形排列的文字识别的效率。
附图说明
[0020]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技 术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅 仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳 动性的前提下,还可以根据这些附图获得其他的附图。
[0021]图1本申请
技术介绍
中提到的现有的文字识别模型识别效果不佳的一种场 景示意图;
[0022]图2本申请本申请
技术介绍
中提到的现有的文字识别模型识别效果不佳的 另一种场景示意图中;
[0023]图3本申请实施例中的文字识别方法的应用环境示意图;
[0024]图4本申请一实施例提供的一种文字识别方法的实现流程图;
[0025]图5本申请一实施例中的曲形文字区域中每个文字和其对应的文字定位框 的示意图;
[0026]图6本申请一实施例中根据每个文字定位框中线的倾斜程度将文字转正的 示意图;
[0027]图7本申请一实施例中正向文字内容中的每个文字的外接矩形的示意图;
[0028]图8本申请一实施例中步骤S4所包含的子步骤流程图;
[0029]图9本申请一实施例中步骤S41所包含的子步骤流程图;
[0030]图10本申请一实施例中对曲形文字区域进行定位得到边界点集的示意图;
[0031]图11本申请一实施例中对曲形文字区域的边界点集进行分割的示意图;
[0032]图12本申请一实施例中得到曲形文字区域的上边界点集和其对应的起始 点的示意图;
[0033]图13本申请一实施例中文字定位框和其对应的四个定位点的示意图;
[0034]图14本申请一实施例中文字定位框之间的位置关系的示意图;
[0035]图15本申请一实施例中曲形文字的排列呈首尾距离较近的半闭合形状的 示意图;
[0036]图16本申请一实施例中提供的一种文字识别装置的结构图;
[0037]图17本申请一实施例中计算机设备的一示意图。
具体实施方式
[0038]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部 的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳 动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0039]在文本识别领域,文本识别是通过文本定位算法先定位到文本区域,再针 对文本区域的文字进行识别。在具体应用中,由于一些关键信息在呈弧度排列 的文本中,故需要对这些曲线排列的文字进行识别,我们需要识别出沿曲线排 列的文字供后续处理,若这个工作交给人工来识别分拣,显然是枯燥和效率低 下的,且在对实时性要求较高的业务中会造成很大的不便。随着文字定位算法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文字识别方法,其特征在于,所述方法包括:对图像中曲形排列的文字内容进行文字定位,得到每个文字所对应的文字定位框;根据每个所述文字定位框的中线与水平方向的夹角,对每个所述文字进行旋转操作,得到正向文字内容;根据所述正向文字内容中的每个文字的外接矩形,调整所述正向文字内容中的文字的大小,得到调整后的文字;根据所述曲形排列的文字内容中的所述文字定位框之间的位置关系,将所述调整后的文字排列在一条水平直线上,得到待识别文本内容;对所述待识别文本内容进行文字识别,得到文本识别结果。2.如权利要求1所述的文字识别方法,其特征在于,所述根据每个所述文字定位框的中线与水平方向的夹角,对每个所述文字进行旋转操作,得到正向文字内容包括:获取所述文字定位框的中线与水平方向的夹角,根据所述文字定位框的中线与水平方向的夹角将每个所述文字旋转至正向,所述正向为所述文字定位框的中线与水平方向的夹角为直角的方向。3.如权利要求1所述的文字识别方法,其特征在于,调整所述正向文字内容中的文字的大小的方法为:计算所有文字的外接矩形的高的均值,当所述文字的外接矩形的高小于预定值时,将所述文字放大至所述文字的外接矩形的高等于所述均值的程度;当所述文字的外接矩形的高大于所述均值时,将所述文字缩小至所述文字的外接矩形的高等于所述均值的程度。4.如权利要求1所述的文字识别方法,其特征在于,所述根据所述曲形排列的文字内容中的所述文字定位框之间的位置关系,将所述调整后的文字排列在一条水平直线上,得到待识别文本内容包括:在所述曲形排列的文字内容中确定起始文字定位框,根据所述起始文字定位框建立定位框排序表;以所述起始定位框为基准,根据其他文字定位框与所述起始定位框的距离确定扩展方向,并将所述扩展方向上与所述起始文字定位框距离最近的文字定位框扩展进所述定位框排序表,以新扩展进所述定位框排序表中的文字定位框为基准对余下的所述其他文字定位框进行扩展,直至将全部的所述文字定位框扩展进所述定位框排序表;按照所述定位框排序表中的所述文字定位框的排列顺序,将所述调整后的文字排列在一条水平直线上,得到待识别文本内容。5.如权...

【专利技术属性】
技术研发人员:游锦成
申请(专利权)人:平安健康保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1