一种基于深度学习的票据旋转角度检测方法技术

技术编号:26792629 阅读:45 留言:0更新日期:2020-12-22 17:08
本发明专利技术公开了一种基于深度学习的票据旋转角度检测方法,基于STN网络和修改后的EfficientNet网络,将通用的图片分类技术EfficientNet修改后应用至发票角度检测问题,并利用Spatial Transformer Networks(STN)网络加以改进,以提升扭曲、倾斜等质量差票据的角度检测精度,能高效准确地解决发票图片的旋转角度检测问题。

【技术实现步骤摘要】
一种基于深度学习的票据旋转角度检测方法
本专利技术涉及模式识别图像处理
,特别涉及一种基于深度学习的票据旋转角度检测方法。
技术介绍
发票的旋转角度检测在票据自动校正、票据识别等领域,具有很重要的地位。发票的角度自动旋转校正,通常在财务记账流程、发票识别等领域是一个前置步骤。传统的发票旋转角度校正做法通常是通过传统图像处理中的轮廓提取、线条检测、频谱盲检测等技术手段来实现,这些方法在票据收到阴影、局部扭曲、条纹干扰等噪声干扰的情况下,效率低下且易出错。
技术实现思路
本专利技术的目的是克服上述
技术介绍
中不足,提供一种基于深度学习的票据旋转角度检测方法,基于STN网络和修改后的EfficientNet网络,将通用的图片分类技术EfficientNet修改后应用至发票角度检测问题,并利用SpatialTransformerNetworks(STN)网络加以改进,以提升扭曲、倾斜等质量差票据的角度检测精度,能高效准确地解决发票图片的旋转角度检测问题。为了达到上述的技术效果,本专利技术采取以下技术方案:一种基于本文档来自技高网...

【技术保护点】
1.一种基于深度学习的票据旋转角度检测方法,其特征在于,包括步骤:/nA.收集训练数据并进行旋转角度标定及数据扩充;/nB.将经步骤A处理的数据划分为训练集和验证集;/nC.构建网络模型STNEfficientNet,并分别利用训练集和验证集的数据进行训练和验证;其中,对网络模型进行训练时训练误差函数为MeanSquareError误差函数,且利用ADAM算法进行模型算法更新;/nD.利用训练好的网络模型对上传的新的票据自动进行旋转角度检测。/n

【技术特征摘要】
1.一种基于深度学习的票据旋转角度检测方法,其特征在于,包括步骤:
A.收集训练数据并进行旋转角度标定及数据扩充;
B.将经步骤A处理的数据划分为训练集和验证集;
C.构建网络模型STNEfficientNet,并分别利用训练集和验证集的数据进行训练和验证;其中,对网络模型进行训练时训练误差函数为MeanSquareError误差函数,且利用ADAM算法进行模型算法更新;
D.利用训练好的网络模型对上传的新的票据自动进行旋转角度检测。


2.根据权利要求1所述的一种基于深度学习的票据旋转角度检测方法,其特征在于,所述步骤A中具体是收集票据图片,且对票据图片进行旋转角度标定后,标定结果记为(Xr,Yr),其中,Xr=[Xr1,Xr2,…,Xrn],Yr=[Yr1,Yr2,…,Yrn],n为收集到的票据图片数量,Xr中的每一项表示一张图片,Yr中的每一项表示对应的票据图片标定的旋转角度。


3.根据权利要求2所述的一种基于深度学习的票据旋转角度检测方法,其特征在于,所述步骤A中对数据扩充时具体包括以下步骤:
S1.收集ImageNet图片分类数据集,从中随机选取N1张图片;
S2.按照特定比例收集特定格式的数据,其中,数据的总页码大于N1;
S3.将步骤S2收集的数据转为png格式的图片,并从中随机选择N1张转化后的图片;
S4.将上述步骤S1及步骤S3获取的总量N=2*N1的图片的旋转角度标定为0°;
S5.将已完成旋转角度标定的收集的票据图片记为ImageSet1,将步骤S4中完成标定的图片记为ImageSet2,并将ImageSet1和ImageSet2合并为总数据记为TotalDataset。


4.根据权利要求3所述的一种基于深度学习的票据旋转角度检测方法,其特征在于,所述步骤S2中特定格式分别为PDF、PPT、WORD,对应的比例为5:3:2。


5.根据权利要求3所述的一种基于深度学习的票据旋转角度检测方法,其特征在于,所述步骤B具体是将总数据TotalDataset分为训练集TrainDataset和验证集ValidationDataset,具体为:
S1.将ImageSet1按特定比例随机划分成两部分,分别记为ImageSet1Val和ImageSet1Train;
同时,将ImageSet2按特定比例随机划分成两部分,分别记为ImageSet2Val和ImageSet2Train;
S2.将ImageSet1Val和ImageSet2Val合并,记为ValidationDataset;将ImageSet1Train和ImageSet2Train合并,记为TrainDataset。


6.根据权利要求5所述的一种基于深度学习的票据旋转角度检测方法,其特征在于,所述步骤C中构建网络模型STNEfficientNet的步骤如下:
S1.构建一个空间变换网络STN;
S2.构建Efficien...

【专利技术属性】
技术研发人员:肖欣庭唐军刘楚雄池明辉杨懿龄赵冬
申请(专利权)人:四川长虹电器股份有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1