【技术实现步骤摘要】
一种弯曲文本矫正方法
[0001]本专利技术属于计算机视觉及文本检测识别
,具体涉及一种弯曲文本矫正方法。
技术介绍
[0002]现有的弯曲文本检测处理方法有利用回归的方法解决弯曲文本的检测问题,用多点坐标描述弯曲文本的边界多边形,然后直接预测多边形的顶点坐标。例如CTD提出了直接预测弯曲文本14个顶点的边界多边形,网络中利用Bi
‑
LSTM层已细化顶点的预测坐标,实现了基于回归方法的弯曲文本检测;这种基于机器学习中模型的方法,不仅需要收集数据集进行训练,模型复杂度高,所需要的成本比较高,并且适用的场景较为单一。
[0003]公开号为CN113989298A的中国专利提出了一种用于合同文档弯曲文本行校正的方法,具体地:对文本图像进行文本检测,获得文本图像的分割后的二值化图;遍历二值化图中的连通区域,求取最小外接矩形;判断二值化图中的连通区域是否均已经过处理,是,则直接跳过处理,否,则进入下一步骤;计算连通区域的像素点个数与外接矩形的面积的实际重叠比值,设置重叠比值阈值,将重叠比值阈值与实际重叠 ...
【技术保护点】
【技术特征摘要】
1.一种弯曲文本矫正方法,包括如下步骤:(1)对文本图像进行文本检测,得到经文本检测分割后的二值化图;(2)对二值化图内的每个连通区域进行细直化操作得到对应的连通曲线;(3)利用轮廓点对连通曲线进行拟合得到其数学方程表达,同时记录连通曲线的左右端点坐标;(4)对于需要做文本弯曲矫正的连通区域,从其对应的连通曲线上确定参考分界点;(5)利用参考分界点对连通区域进行拆分,并对连通区域内的文本框进行矫正;(6)输出矫正后的文本图像。2.根据权利要求1所述的弯曲文本矫正方法,其特征在于:所述步骤(1)中采用基于分割的DBnet文本检测算法对文本图像进行文本检测。3.根据权利要求1所述的弯曲文本矫正方法,其特征在于:所述步骤(3)中采用寻找轮廓点的方法对连通曲线进行寻找轮廓点操作,并对寻找到的轮廓点进行去重和排序操作,进而利用这些轮廓点对连通曲线进行拟合得到其数学方程表达,同时记录每条连通曲线的左端点坐标和右端点坐标。4.根据权利要求3所述的弯曲文本矫正方法,其特征在于:采用最小二乘法对连通曲线进行拟合得到其数学方程表达。5.根据权利要求1所述的弯曲文本矫正方法,其特征在于:所述步骤(4)的具体实现方式如下:首先从连通曲线上均匀取20个点,对于其中任一点p,确定连通曲线左端点与点p所在直线L_left,连通曲线右端点与点p所在直线L_right;然后计算直线L_left和L_right与连通曲线之间的距离和distance;依据上述遍历这20个点...
【专利技术属性】
技术研发人员:龚泽挚,刘新天,吴煜彬,
申请(专利权)人:杭州度康科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。