一种基于融合直线与深度学习的图像倾斜校正方法技术

技术编号：32752685 阅读：22 留言：0更新日期：2022-03-23 18:48

本发明专利技术提供一种基于融合直线与深度学习的图像倾斜校正方法，首先，分析图像二值化的直线特征，其次，通过霍夫直线进行直线检测，采用种子区域生长算法将角度差小于α、距离差小于d的线段进行区域生长，融合区域内的直线，得到融合后的线段长度top k，然后，采用滑动窗口进行直线归类，将top k直线中角度差小于β的直线归为一类，寻找直线密集区，根据密集区的密集度判断直线角度是否可信，若密集度可信，则通过密集度最高直线的角度进行校正，若密集度不可信，则通过文字倾斜角度计算，进行倾斜校正，为防止影像翻转为垂直方向，将校正后的图像进行抬头轮廓的获取，根据抬头位置判断结果，进行对应旋转，图像倾斜校正完成。图像倾斜校正完成。图像倾斜校正完成。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于融合直线与深度学习的图像倾斜校正方法

[0001]本专利技术属于图像识别、视频分析领域，尤其涉及一种基于融合直线与深度学习的图像倾斜校正方法。

技术介绍

[0002]在一个图像处理的系统中，获得图像后，一般要对其进行预处理。在银行、财税、证券等行业的金融票据电子影像系统、汽车牌照的抓拍识别系统，选票自动识别系统以及OCR识别等系统中，通过输入设备获得的图像不可避免地会发生倾斜，这会给后面的图像分割、字符识别等图像处理与分析带来很多困难。因此，在这些系统中，倾斜校正是图像预处理的重要部分。
[0003]现代社会，尽管电子支付、电子票据等发展日益增多，传统纸质票据仍然被广泛使用，如各类纸质发票、金融票据等。目前，财务部门平均每天有大量的票据影像，多岗位员工需要对同一张票据进行重复稽核，不仅耗费人力，而且降低了报账效率。通过图像OCR技术实现票面信息的提取，将提取的票面信息与报账信息进行对比，实现自动稽核；OCR提取的票据信息存入数据库中，相当于一个具有极强记忆力的大脑，可以很容易发现报账名称和纳税人识别号不一致，...

【技术保护点】

【技术特征摘要】
1.一种基于融合直线与深度学习的图像倾斜校正方法，其特征在于：包括以下步骤：步骤1：图像二值化，突出图像中文字以及直线的特征；步骤2：通过霍夫直线进行直线检测，计算直线角度θ；步骤3：采用种子区域生长算法将满足生长准则的直线进行融合，选取融合后线段长度的top k；步骤4：滑动窗口进行top k直线归类，将角度相差小于β的直线归为一类，寻找直线密集区，根据密集区的密集度判断直线角度是否可信；步骤5：若直线角度可信，则进行倾斜校正，若密集度不可信，则通过文字角度，进行倾斜校正；步骤6：截取影像上下左右各四分之一大小，设置文字抬头的长宽比阈值G，获取图像的抬头信息，通过大量样本作为训练数据进行深度学习；步骤7：将校正后的图像进行抬头轮廓获取，若在上部区域获得抬头轮廓，则保存倾斜后的图像，若在左部区域获得抬头轮廓，则进行90
°
顺时针旋转；若在右部区域获得抬头轮廓，则进行90
°
逆时针旋转；若在下部区域获得抬头轮廓，则进行180
°
旋转，至此，完成倾斜校正。2.根据权利要求1所述的一种基于融合直线与深度学习的图像倾斜校正方法，其特征在于：所述的步骤3包括以...

【专利技术属性】
技术研发人员：于志文，糜俊，
申请(专利权)人：中电鸿信信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人