一种弯曲文本矫正方法技术

技术编号:37348104 阅读:13 留言:0更新日期:2023-04-22 21:44
本发明专利技术公开了一种弯曲文本矫正方法,根据分割图中连通区域的位置信息,对弯曲本文进行矫正,操作过程较为简单,不需要构建任何模型,矫正效果较佳,且无需进行单字符切分,避免了对文本内容的依赖,有助于对原始图像进行恢复,同时较佳的文本矫正结果也有利于提高文本识别的准确率,适用于多种文本图像场景,具有较强的普适性。此外,本发明专利技术方法在分割图中仅对弯曲本文进行矫正,有效降低了未弯曲文本因被矫正而产生变形的可能性。被矫正而产生变形的可能性。被矫正而产生变形的可能性。

【技术实现步骤摘要】
一种弯曲文本矫正方法


[0001]本专利技术属于计算机视觉及文本检测识别
,具体涉及一种弯曲文本矫正方法。

技术介绍

[0002]现有的弯曲文本检测处理方法有利用回归的方法解决弯曲文本的检测问题,用多点坐标描述弯曲文本的边界多边形,然后直接预测多边形的顶点坐标。例如CTD提出了直接预测弯曲文本14个顶点的边界多边形,网络中利用Bi

LSTM层已细化顶点的预测坐标,实现了基于回归方法的弯曲文本检测;这种基于机器学习中模型的方法,不仅需要收集数据集进行训练,模型复杂度高,所需要的成本比较高,并且适用的场景较为单一。
[0003]公开号为CN113989298A的中国专利提出了一种用于合同文档弯曲文本行校正的方法,具体地:对文本图像进行文本检测,获得文本图像的分割后的二值化图;遍历二值化图中的连通区域,求取最小外接矩形;判断二值化图中的连通区域是否均已经过处理,是,则直接跳过处理,否,则进入下一步骤;计算连通区域的像素点个数与外接矩形的面积的实际重叠比值,设置重叠比值阈值,将重叠比值阈值与实际重叠比值进行比较,若实际重叠比值大于重叠比值阈值,则进入下一步骤,否,则返回至上一步骤;对连通区域进行曲线拟合,并获取曲线的拐点;对拐点进行修正。该专利技术虽然属于弯曲文本提取,但是只局限于合同文档弯曲文本的处理,用于其他场景例如用于书籍弯曲文本存在一定的错误性。
[0004]公开号为CN113139537A的中国专利提出了一种通过图像处理方法、电子电路、视障辅助设备和介质对弯曲文本行进行弯曲处理的方法,具体地:对输入图像进行文本行检测,以得到包括弯曲文本行的文本行图像;确定文本行图像中用于弯曲文本行的多个参考点;基于多个参考点确定用于弯曲文本行的文本行曲线;利用基于文本行曲线确定的调整参数对弯曲文本行进行调整,以得到对应于弯曲文本行的识别文本行,其中识别文本行包括水平显示的多个字符;该专利技术是通过图像处理与外部硬件相互配合处理,实现弯曲文本处理,所需成本较高。

技术实现思路

[0005]鉴于上述,本专利技术提供了一种弯曲文本矫正方法,操作过程较为简单,不需要构建任何模型,矫正效果较佳。
[0006]一种弯曲文本矫正方法,包括如下步骤:
[0007](1)对文本图像进行文本检测,得到经文本检测分割后的二值化图;
[0008](2)对二值化图内的每个连通区域进行细直化操作得到对应的连通曲线;
[0009](3)利用轮廓点对连通曲线进行拟合得到其数学方程表达,同时记录连通曲线的左右端点坐标;
[0010](4)对于需要做文本弯曲矫正的连通区域,从其对应的连通曲线上确定参考分界点;
[0011](5)利用参考分界点对连通区域进行拆分,并对连通区域内的文本框进行矫正;
[0012](6)输出矫正后的文本图像。
[0013]进一步地,所述步骤(1)中采用基于分割的DBnet文本检测算法对文本图像进行文本检测。
[0014]进一步地,所述步骤(3)中采用寻找轮廓点的方法对连通曲线进行寻找轮廓点操作,并对寻找到的轮廓点进行去重和排序操作,进而利用这些轮廓点对连通曲线进行拟合得到其数学方程表达,同时记录每条连通曲线的左端点坐标和右端点坐标。
[0015]进一步地,采用最小二乘法对连通曲线进行拟合得到其数学方程表达。
[0016]进一步地,所述步骤(4)的具体实现方式如下:首先从连通曲线上均匀取20个点,对于其中任一点p,确定连通曲线左端点与点p所在直线L_left,连通曲线右端点与点p所在直线L_right;然后计算直线L_left和L_right与连通曲线之间的距离和distance;依据上述遍历这20个点,取distance最小的点记为c,若满足以下条件,则将点c视为参考分界点;否则判定对应的连通区域无需做文本弯曲矫正;
[0017]|k_left

k_right|>threshold
[0018]其中:k_left为连通曲线左端点与点c所在直线的斜率,k_right为连通曲线右端点与点c所在直线的斜率,threshold为阈值。
[0019]进一步地,计算直线L_left和L_right与连通曲线之间距离和distance的具体实现方式为:首先再从连通曲线上均匀取50个点,在这50个点中,计算位于点p左侧的所有点到直接L_left的距离和,计算位于点p右侧的所有点到直接L_right的距离和,再将这两部分距离和相加即为直线L_left和L_right与连通曲线之间的距离和distance。
[0020]进一步地,所述步骤(5)的具体实现方式如下:首先根据参考分界点对连通区域进行拆分,使原本的一个连通区域变为左右两个子连通区域;然后计算确定两个子连通区域的最小外接矩形;最后使用透视变换方法对左右两个最小外接矩形在文本图像中对应位置的文本框进行矫正。
[0021]进一步地,所述步骤(6)中对于需要做文本弯曲矫正的连通区域,将左右两个最小外接矩形在文本图像中对应位置矫正后的文本框进行拼接,从而达到矫正的目的,输出弯曲矫正处理后的文本图像。
[0022]本专利技术根据分割图中连通区域的位置信息,对弯曲本文进行矫正,操作过程较为简单,不需要构建任何模型,矫正效果较佳,且无需进行单字符切分,避免了对文本内容的依赖,有助于对原始图像进行恢复,同时较佳的文本矫正结果也有利于提高文本识别的准确率,适用于多种文本图像场景,具有较强的普适性。此外,本专利技术方法在分割图中仅对弯曲本文进行矫正,有效降低了未弯曲文本因被矫正而产生变形的可能性。
附图说明
[0023]图1为本专利技术弯曲文本矫正方法的流程示意图。
[0024]图2为原始文本图像。
[0025]图3为文本检测后得到的二值化图。
[0026]图4为二值化图经细直化后的图像结果。
[0027]图5为含有拟合连通曲线的文本图像。
[0028]图6为单个连通区域拆分后的二值化图。
[0029]图7为所有连通区域拆分后的二值化图。
[0030]图8为原始文本图像中对应左右两个子连通区域的矫正效果图。
[0031]图9为未做矫正的文本框效果图。
[0032]图10为矫正后的文本框效果图。
具体实施方式
[0033]为了更为具体地描述本专利技术,下面结合附图及具体实施方式对本专利技术的技术方案进行详细说明。
[0034]如图1所示,本专利技术弯曲文本矫正方法具体实现包括如下步骤:
[0035](1)对文本图像进行文本检测,进而获取到该图像分割后二值化图。
[0036]本实施方式使用基于分割的DBnet文本检测算法进行文本检测,从而获取到分割后二值化图。基于分割的文本检测算法为文本图像二值分割图的基础模型,该检测方法直接影响文本框的定位,影响到后期文本框的定位,因此需要训练文本检测模型,DBnet网络对每一个像素点进行自适应二值化,二值化阈值由网本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种弯曲文本矫正方法,包括如下步骤:(1)对文本图像进行文本检测,得到经文本检测分割后的二值化图;(2)对二值化图内的每个连通区域进行细直化操作得到对应的连通曲线;(3)利用轮廓点对连通曲线进行拟合得到其数学方程表达,同时记录连通曲线的左右端点坐标;(4)对于需要做文本弯曲矫正的连通区域,从其对应的连通曲线上确定参考分界点;(5)利用参考分界点对连通区域进行拆分,并对连通区域内的文本框进行矫正;(6)输出矫正后的文本图像。2.根据权利要求1所述的弯曲文本矫正方法,其特征在于:所述步骤(1)中采用基于分割的DBnet文本检测算法对文本图像进行文本检测。3.根据权利要求1所述的弯曲文本矫正方法,其特征在于:所述步骤(3)中采用寻找轮廓点的方法对连通曲线进行寻找轮廓点操作,并对寻找到的轮廓点进行去重和排序操作,进而利用这些轮廓点对连通曲线进行拟合得到其数学方程表达,同时记录每条连通曲线的左端点坐标和右端点坐标。4.根据权利要求3所述的弯曲文本矫正方法,其特征在于:采用最小二乘法对连通曲线进行拟合得到其数学方程表达。5.根据权利要求1所述的弯曲文本矫正方法,其特征在于:所述步骤(4)的具体实现方式如下:首先从连通曲线上均匀取20个点,对于其中任一点p,确定连通曲线左端点与点p所在直线L_left,连通曲线右端点与点p所在直线L_right;然后计算直线L_left和L_right与连通曲线之间的距离和distance;依据上述遍历这20个点...

【专利技术属性】
技术研发人员:龚泽挚刘新天吴煜彬
申请(专利权)人:杭州度康科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1