一种图像处理方法、装置、设备以及存储介质制造方法及图纸

技术编号:35642077 阅读:13 留言:0更新日期:2022-11-19 16:33
本发明专利技术公开了一种图像处理方法、装置、设备以及存储介质。该图像处理方法包括:获取待处理图像的多个文本区域;调整与所述待处理图像的水平中线距离最近的第一文本区域,得到水平的目标文本行。采用本发明专利技术的技术方案,第一文本区域中的文本不少为弯曲文本,通过调整第一文本区域,得到水平的目标文本行,包括目标文本行的图像进行文本识别,可以提高文本识别率和识别准确度,计算量小、速度快、鲁棒性好以及实用性强。及实用性强。及实用性强。

【技术实现步骤摘要】
一种图像处理方法、装置、设备以及存储介质


[0001]本专利技术涉及数字图像处理
,尤其涉及一种图像处理方法、装置、设备以及存储介质。

技术介绍

[0002]光学字符识别技术是指电子设备(比如:扫描仪)检查纸质文档上打印的文本,通过检测暗、亮的模式确定其形状,将纸质文档中的文本转换成为黑白点阵的图像文件,并通过识别软件将图像中的文本转换成可编辑的文本格式,供文本处理软件进一步编辑加工的技术。然而,该技术对于在同一水平线上的文本具有很好的识别效果;若待识别的图像是根据弯曲的文本或者不在同一水平线上的文本扫描得到的,容易导致识别的准确率不高。
[0003]目前,为保证光学字符识别算法能够获取到水平的文本往往需要固定的扫描台设备以及激光发生装置,不仅成本高,速度慢,而且可支持的场景单一;或者根据传统的图像处理算法,对图像进行二值化、计算连通域等操作使得与弯曲文本对应的图像在送入识别算法之后得到较好的识别率,其需要设置超参数、操作复杂,并且鲁棒性差。

技术实现思路

[0004]本专利技术提供了一种图像处理方法、装置、设备以及存储介质,矫正了包括弯曲文本的待处理图像,简单高效的提升图像的识别率。
[0005]根据本专利技术的第一方面,提供了一种图像处理方法,该方法包括:
[0006]获取待处理图像的多个文本区域;
[0007]调整与所述待处理图像的水平中线距离最近的第一文本区域,得到水平的目标文本行。
[0008]可选的,所述第一文本区域对应于所述待处理图像的水平中线的初始文本行。
[0009]进一步的,所述初始文本行,包括:
[0010]根据水平方向上两个或两个以上相邻文本区域组成集合的横坐标,确定第一集合;
[0011]根据经过所述第一集合内末端文本区域中心点的第一水平线,确定除第一集合之外的其他在竖直方向上相邻的集合的中心点与所述第一水平线距离最近的第二集合;
[0012]根据经过所述第二集合内末端文本区域中心点的第二水平线,确定除第一集合以及第二集合之外的其他在竖直方向上相邻的集合的中心点与所述第二水平线距离最近的第三集合,得到包括所述第一集合、所述第二集合以及所述第三集合的初始文本行。
[0013]进一步的,所述根据水平方向上两个或两个以上相邻文本区域组成集合的横坐标,确定第一集合,包括:
[0014]将所述待处理图像中的多个文本区域依据同一水平方向以及相同的数量划分为两个或两个以上的集合,同一文本区域仅存在于单个集合之中;
[0015]根据各集合内首个文本区域的横坐标的数值对所述集合正序排列确定在先的集
合序列;
[0016]判断所述集合序列中各集合的中心点到所述中线的距离最小的集合,得到所述第一集合。
[0017]进一步的,所述根据经过所述第一集合内末端文本区域中心点的第一水平线,确定除第一集合之外的其他在竖直方向上相邻的集合的中心点与所述第一水平线距离最近的第二集合,包括:
[0018]确定所述第一集合内末端文本区域中心点的第一坐标;
[0019]经过所述第一坐标对应的点作平行于所述水平中线的第一水平线,选择除第一集合之外的其他在竖直方向上相邻的集合的中心点到所述第一水平线距离最近的相邻集合作为所述第二集合。
[0020]可选的,合并在垂直方向上区分度极小的文本区域,得到所述初始文本行。
[0021]可选的,所述调整与所述待处理图像的水平中线距离最近的第一文本区域,得到水平的目标文本行,包括:
[0022]计算由所述第一文本区域中相邻两个文本区域中心点所确定的直线斜率;
[0023]根据所述直线斜率确定所述仿射变换的参数值;
[0024]根据所述参数值依次调整所述文本区域在垂直方向上的角度,得到水平的目标文本行。
[0025]根据本专利技术的第二方面,提供了一种图像处理装置,该装置包括:
[0026]获取模块,用于获取待处理图像的多个文本区域;
[0027]调整模块,用于调整与所述待处理图像的水平中线距离最近的第一文本区域,得到水平的目标文本行。
[0028]根据本专利技术的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器实现如本专利技术任一实施例所述的图像处理方法。
[0029]根据本专利技术的第四方面,提供了一种计算机可读存储介质,所述计算机指令用于使所述计算机执行如本专利技术任一实施例所述的图像处理方法。
[0030]本专利技术公开了一种图像处理方法、装置、设备以及存储介质。该图像处理方法包括:获取待处理图像的多个文本区域;调整与所述待处理图像的水平中线距离最近的第一文本区域,得到水平的目标文本行。采用本专利技术的技术方案,第一文本区域中的文本不少为弯曲文本,通过调整第一文本区域,得到水平的目标文本行,包括目标文本行的图像进行文本识别,可以提高文本识别率和识别准确度,计算量小、速度快、鲁棒性好以及实用性强。
[0031]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0032]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他
的附图。
[0033]图1是根据本专利技术实施例提供的一种图像处理方法的流程示意图;
[0034]图2a是根据本专利技术实施例提供的一种待处理图像的示意图;
[0035]图2b是根据本专利技术实施例提供的另一种待处理图像的示意图;
[0036]图3a是根据本专利技术实施例提供的一种待处理图像中文本区域的示意图;
[0037]图3b是根据本专利技术实施例提供的另一种待处理图像中文本区域的示意图;
[0038]图4a是根据本专利技术实施例提供的一种初始文本行的示意图;
[0039]图4b是根据本专利技术实施例提供的另一种初始文本行的示意图;
[0040]图5a是根据本专利技术实施例提供的一种目标文本行的示意图;
[0041]图5b是根据本专利技术实施例提供的另一种目标文本行的示意图;
[0042]图6是根据本专利技术实施例提供的一种图像处理装置的结构示意图;
[0043]图7是用来实现本专利技术实施例的图像处理方法的电子设备的框图。
具体实施方式
[0044]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法,其特征在于,所述方法包括:获取待处理图像的多个文本区域;调整与所述待处理图像的水平中线距离最近的第一文本区域,得到水平的目标文本行。2.根据权利要求1所述的方法,其特征在于,所述第一文本区域对应于所述待处理图像的水平中线的初始文本行。3.根据权利要求2所述的方法,其特征在于,所述初始文本行,包括:根据水平方向上两个或两个以上相邻文本区域组成集合的横坐标,确定第一集合;根据经过所述第一集合内末端文本区域中心点的第一水平线,确定除第一集合之外的其他在竖直方向上相邻的集合的中心点与所述第一水平线距离最近的第二集合;根据经过所述第二集合内末端文本区域中心点的第二水平线,确定除第一集合以及第二集合之外的其他在竖直方向上相邻的集合的中心点与所述第二水平线距离最近的第三集合,得到包括所述第一集合、所述第二集合以及所述第三集合的初始文本行。4.根据权利要求3所述的方法,其特征在于,所述根据水平方向上两个或两个以上相邻文本区域组成集合的横坐标,确定第一集合,包括:将所述待处理图像中的多个文本区域依据同一水平方向以及相同的数量划分为两个或两个以上的集合,同一文本区域仅存在于单个集合之中;根据各集合内首个文本区域的横坐标的数值对所述集合正序排列确定在先的集合序列;判断所述集合序列中各集合的中心点到所述中线的距离最小的集合,得到所述第一集合。5.根据权利要求3所述的方法,其特征在于,所述根据经过所述第一集合内末端文本区域中心点的第一水平线,确定除第一集合之外的其他在竖直方向上相邻的集合的中...

【专利技术属性】
技术研发人员:杨文博李深圳孙磊磊
申请(专利权)人:北京如布科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1