【技术实现步骤摘要】
一种基于融合直线与深度学习的图像倾斜校正方法
[0001]本专利技术属于图像识别、视频分析领域,尤其涉及一种基于融合直线与深度学习的图像倾斜校正方法。
技术介绍
[0002]在一个图像处理的系统中,获得图像后,一般要对其进行预处理。在银行、财税、证券等行业的金融票据电子影像系统、汽车牌照的抓拍识别系统,选票自动识别系统以及OCR识别等系统中,通过输入设备获得的图像不可避免地会发生倾斜,这会给后面的图像分割、字符识别等图像处理与分析带来很多困难。因此,在这些系统中,倾斜校正是图像预处理的重要部分。
[0003]现代社会,尽管电子支付、电子票据等发展日益增多,传统纸质票据仍然被广泛使用,如各类纸质发票、金融票据等。目前,财务部门平均每天有大量的票据影像,多岗位员工需要对同一张票据进行重复稽核,不仅耗费人力,而且降低了报账效率。通过图像OCR技术实现票面信息的提取,将提取的票面信息与报账信息进行对比,实现自动稽核;OCR提取的票据信息存入数据库中,相当于一个具有极强记忆力的大脑,可以很容易发现报账名称和纳税人识别号不一致, ...
【技术保护点】
【技术特征摘要】
1.一种基于融合直线与深度学习的图像倾斜校正方法,其特征在于:包括以下步骤:步骤1:图像二值化,突出图像中文字以及直线的特征;步骤2:通过霍夫直线进行直线检测,计算直线角度θ;步骤3:采用种子区域生长算法将满足生长准则的直线进行融合,选取融合后线段长度的top k;步骤4:滑动窗口进行top k直线归类,将角度相差小于β的直线归为一类,寻找直线密集区,根据密集区的密集度判断直线角度是否可信;步骤5:若直线角度可信,则进行倾斜校正,若密集度不可信,则通过文字角度,进行倾斜校正;步骤6:截取影像上下左右各四分之一大小,设置文字抬头的长宽比阈值G,获取图像的抬头信息,通过大量样本作为训练数据进行深度学习;步骤7:将校正后的图像进行抬头轮廓获取,若在上部区域获得抬头轮廓,则保存倾斜后的图像,若在左部区域获得抬头轮廓,则进行90
°
顺时针旋转;若在右部区域获得抬头轮廓,则进行90
°
逆时针旋转;若在下部区域获得抬头轮廓,则进行180
°
旋转,至此,完成倾斜校正。2.根据权利要求1所述的一种基于融合直线与深度学习的图像倾斜校正方法,其特征在于:所述的步骤3包括以...
【专利技术属性】
技术研发人员:于志文,糜俊,
申请(专利权)人:中电鸿信信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。