用于合同文档弯曲文本行校正的方法技术

技术编号：32127985 阅读：23 留言：0更新日期：2022-01-29 19:20

本发明专利技术涉及合同文档技术领域，尤其涉及一种用于合同文档弯曲文本行校正的方法，包括如下步骤：步骤S1：对文本图像进行文本检测，获得文本图像的分割后的二值化图；步骤S2：遍历二值化图中的连通区域，求取最小外接矩形；骤S3：判断二值化图中的连通区域是否均已经过处理，是，则直接跳至步骤S9，否，则进入下一步骤；步骤S4：计算连通区域的像素点个数与外接矩形的面积的实际重叠比值，设置重叠比值阈值，将重叠比值阈值与实际重叠比值进行比较，若实际重叠比值大于重叠比值阈值，则进入下一步骤，否，则返回至步骤S3；步骤S5：对连通区域进行曲线拟合，并获取曲线的拐点；步骤S6：对拐点进行修正。正。正。

全部详细技术资料下载

【技术实现步骤摘要】
用于合同文档弯曲文本行校正的方法

[0001]本专利技术涉及合同文档
，尤其涉及一种用于合同文档弯曲文本行校正的方法。

技术介绍

[0002]现有的弯曲文本处理，一般都是针对特定场景的弯曲文本进行处理，无法处理结构体文档文本。针对特定场景下的弯曲文本矫正，需要检测每个字符位置，及一些聚类算法拟合曲线，操作复杂且依赖于单个字符的检测算法误差累积影响，单字符检测因为特征小容易检测出错，同时如果是文档结构性文本行，聚类拟合文本曲线容易串行等极大的影响最终校正结果。目前已经存在非常成熟的文本行检测算法，检测精度非常高，因此可以极大的避免这种单字符检测的误差累积。而基于模型的方法，需要构造数据集并设计网络模型进行训练，需要的成本比较高，网络相对复杂度比较高，无法描述到学习到的映射内容意义。
[0003]因此，现有技术存在不足，需要改进。

技术实现思路

[0004]为克服上述的技术问题，本专利技术提供了一种用于合同文档弯曲文本行校正的方法。
[0005]本专利技术解决技术问题的方案是提供一种用于合同文档弯曲文本行校正的方法，包括如下步骤：
[0006]步骤S1：对文本图像进行文本检测，获得文本图像的分割后的二值化图；
[0007]步骤S2：遍历二值化图中的连通区域，求取最小外接矩形；
[0008]步骤S3：判断二值化图中的连通区域是否均已经过处理，是，则直接跳至步骤S9，否，则进入下一步骤；
[0009]步骤S4：计算连通区域的像素点个数与外接矩形...

【技术保护点】

【技术特征摘要】
1.一种用于合同文档弯曲文本行校正的方法，其特征在于：所述用于合同文档弯曲文本行校正的方法包括如下步骤：步骤S1：对文本图像进行文本检测，获得文本图像的分割后的二值化图；步骤S2：遍历二值化图中的连通区域，求取最小外接矩形；步骤S3：判断二值化图中的连通区域是否均已经过处理，是，则直接跳至步骤S9，否，则进入下一步骤；步骤S4：计算连通区域的像素点个数与外接矩形的面积的实际重叠比值，设置重叠比值阈值，将重叠比值阈值与实际重叠比值进行比较，若实际重叠比值大于重叠比值阈值，则进入下一步骤，否，则返回至步骤S3；步骤S5：对连通区域进行曲线拟合，并获取曲线的拐点；步骤S6：对拐点进行修正；步骤S7：在同一行文本行的多个检测框上，以拐点计算各曲线线段弧长，根据曲线斜率变化判断文本框是否需要矫正，是，则进入下一步骤，否，则直接跳至步骤S9；步骤S8：对文本框进行矫正；步骤S9：输出矫...

【专利技术属性】
技术研发人员：陈淑华，石朵伟，
申请(专利权)人：深圳前海环融联易信息科技服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人