基于文本内容四点检测的图像校正方法技术

技术编号：24998272 阅读：29 留言：0更新日期：2020-07-24 18:00

本发明专利技术提供了一种基于文本内容四点检测的图像校正方法，包括如下步骤：a1.使用深度卷积网络对图片进行文本区域的目标检测，得到文本区域在整张图片中的位置坐标；a2.裁剪出文本区域，生成新的图片；a3.在裁剪的图像上，使用深度卷积网络进行带有顺序信息的四点检测；a4.基于四点的坐标信息，将图片进行仿射变换，得到矫正后的文本图像；文本区域在整张图片中的位置坐标是将图像中每一个基于文本内容的整个区域作为检测的目标，通过深度卷积网络进行目标检测得到的。本发明专利技术基于深度神经网络的方法，能够获取极高的准确率和召回率，对文本内容区域的检测，去除了复杂背景的干扰，利用文本区域带有顺序信息的四点检测，可以适用于任何倾斜角度的情况。

全部详细技术资料下载

【技术实现步骤摘要】
基于文本内容四点检测的图像校正方法
本专利技术涉及图像校正
，具体来说，涉及基于文本内容四点检测的图像校正方法。
技术介绍
伴随着数字化技术的发展，办公自动化已经成为了现代社会的基本要求，纸质文件经过设备扫描或者拍摄转成文本图像后更加方便保存，但是扫描过程中，不可避免的会造成文本的倾斜，这种倾斜会对之后的文本的检测识别产生一定的影响，因此文本图像倾斜角度的校正一直都是研究的一个热点。目前普遍采用的方法有以下几种：基于投影特征的方法、基于Hough变换的方法、基于傅立叶变换的方法以及基于K-最近邻簇的方法。现有的方法存在以下问题：1.传统的图像处理方法对噪音的适应性差，当出现光照变化或者背景复杂的情况下较正效果差，无法满足之后文本检测和识别的输入要求；2.适用倾斜角度范围小，当图像倾斜角度大于正负90度时，则无法进行图像文本的校正。目前文本图像校正多采用传统的图像处理算法，很少有人尝试基于深度学习的方法，对文本图像的倾斜角度校正。2014年以来，深度学习开始在物体检测，物体分割等领域取得优秀成果，涌现出Deeplab，YOL本文档来自技高网...

【技术保护点】
1.基于文本内容四点检测的图像校正方法，其特征在于，包括如下步骤：/na1.使用深度卷积网络对图片进行文本区域的目标检测，从而得到文本区域在整张图片中的位置坐标；/na2.裁剪出文本区域，生成新的图片；/na3.在裁剪的图像上，使用深度卷积网络进行带有顺序信息的四点检测；/na4.基于四点的坐标信息，将图片进行仿射变换，得到矫正后的文本图像。/n

【技术特征摘要】
1.基于文本内容四点检测的图像校正方法，其特征在于，包括如下步骤：
a1.使用深度卷积网络对图片进行文本区域的目标检测，从而得到文本区域在整张图片中的位置坐标；
a2.裁剪出文本区域，生成新的图片；
a3.在裁剪的图像上，使用深度卷积网络进行带有顺序信息的四点检测；
a4.基于四点的坐标信息，将图片进行仿射变换，得到矫正后的文本图像。

2.根据权利要求1所述的基于文本内容四点检测的图像校正方法，其特征在于，所述文本区域在整张图片中的位置坐标是将图像中每一个基于文本内容的整个区域作为检测的目标，通过深度卷积网络进行目标检测得到的。

3.根据权利要求1所述的基于文本内容四点检测的图像校正方法，其特征在于，所述文本区域的目标检测可以是使用任何通用的目标检测算法进行的检测。

4.根据权利要求1所述的基于文本内容四点检测的图...

【专利技术属性】
技术研发人员：尤晶晶，侯进，黄贤俊，
申请(专利权)人：深源恒际科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人