一种污损发票识别方法技术

技术编号:28467196 阅读:29 留言:0更新日期:2021-05-15 21:33
本发明专利技术涉及改进AlexNet对不平衡小样本污损发票识别方法。该方法主要如下:针对数据集中的正负样本不平衡问题,利用DCGAN生成对抗网络生成相似的数据样本增加受损发票多样性。再是对AlexNet网络进行针对性改进,有三个改进点:一是加入了1*1卷积核,既帮助减少模型参数,又能增加网络层深度,提升网络模型的特征提取能力;二是加入了通道洗牌模块,将各种特征打乱分布,提高网络对于图片多种特征的更深层次的抓取能力和网络识别的泛化能力和鲁棒性;三是加入了SE模块,通过对特征通道间的相关性进行建模,强化重要的特征来提升准确率。本发明专利技术通过这三点改进AlexNet用于发票识别,针对实际中遇到的破损发票的识别率以及提高识别方法的泛化性和鲁棒性。识别方法的泛化性和鲁棒性。识别方法的泛化性和鲁棒性。

【技术实现步骤摘要】
一种污损发票识别方法


[0001]本专利技术属于计算机视觉和人工智能
,具体涉及一种污损发票识别方法。

技术介绍

[0002]发票自动识别系统是目前文本分类中一个比较热点的方向,发票自动处理系统主要涉及到图像处理、模式识别等方面的学科知识,主要包括图像预处理、信息区域定位、字符切割和识别等处理过程,已被广泛应用于信息处理、差旅报销和人机交互等领域。而由于现实生活中的发票可能存在多种保存问题以及难以预测的污损,由于发票样式的固定性,发票号码和纳税人识别号分别在右上角和左上角,这两个地方被污染的可能性高于其它地方,但如果是折痕或者有大片污迹其它区域的样本也有可能会受损。针对污损发票的识别成为一项重要的研究热点。
[0003]使用机器学习方法进行图像识别主要在于对图像特征的提取,特征提取的有效性影响着识别准确率的高低。深度学习作为机器学习一个新的分支,通过模拟人脑机制对数据信息进行分析处理。深度学习中的卷积神经网络在图像识别领域取得了重大突破,能够自学习图像由低级到高级的特征,避免了机器学习中手动提取特征的缺点。但卷积神经网络在训练时需要海量样本的支撑,在数据不足时,会出现过拟合问题。
[0004]此外,训练样本的不平衡问题是一个值得思考的问题。训练样本某些权值分布较大,某些权值分布较小,最终会影响到卷积神经网络模型的训练和预测时的置信度。
[0005]因此,需要一种新的技术方案来解决利用卷积神经网络对小样本图像识别时会发生的过拟合问题和样本不平衡时置信度低的问题。

技术实现思路
/>[0006]本专利技术提供了一种污损发票识别方法,解决了现有识别方法样本的不平衡问题、传统机器学习方法手动提取特征效率低的问题、现有卷积神经网络需要大量样本支撑训练的问题、现有方法对破损发票进行识别鲁棒性差的问题。
[0007]为了达到上述目的,本专利技术所采用的技术方案是:
[0008]一种污损发票识别方法,包括以下步骤:
[0009]先不写,待定稿后由代理师撰写
[0010]本专利技术的有益效果:
[0011]本专利技术所提出的污损发票识别方法,通过搭建DCGAN对抗神经网络模型对少量标签进行扩充,降低了不平衡问题带来的置信度低的问题;利用卷积神经网络方法避免了手动提取特征的不足,通过改进CNN的方法解决了深度学习用时久耗费资源并需要大量样本支撑训练的缺点。该方法建立的深度神经网络模型,结构更加紧凑,需要的样本量更小,且对不平衡问题也有很好的解决办法。
附图说明
[0012]图1为本专利技术方法的流程图;
[0013]图2为本专利技术方法DCGAN神经网络的生成器模型设计;
[0014]图3为本专利技术方法DCGAN神经网络的判别器模型设计;
[0015]图4为两种不同大小卷积核参数对比示意图;
[0016]图5为本专利技术方法通道洗牌原理示意图;
[0017]图6为本专利技术方法SE模块原理示意图;
[0018]图7为本专利技术方法改进的AlexNet网络结构图。
[0019]具体实施方式
[0020]下面结合附图和具体实施对本专利技术作进一步详细说明。
[0021]本专利技术的基本思路是:针对训练数据集中的正负样本不平衡问题,利用 DCGAN对抗生成网络生成与原始训练数据服从近似分布的数据样本,增加少量样本多样性。再是对用于破损发票识别的AlexNet网络进行针对性改进,有三个改进点:一是卷积神经网络里大的卷积核会导致计算量的暴增,不利于模型深度的增加,计算性能也会降低的问题加入了1*1卷积核,既帮助减少模型参数,又能增加网络层深度,一定程度上提升了网络模型的特征提取能力;二是 AlexNet中全部采用Group Convolution造成的模型泛化能力差的问题加入了通道洗牌模块,将各种特征打乱分布,提高网络对于图片多种特征的更深层次的抓取能力和网络识别的泛化能力和鲁棒性;三是针对发票图片识别率不够高的问题,加入了SE模块,SEnet通过对特征通道间的相关性进行建模,把重要的特征进行强化来提升准确率。本专利技术通过这三点改进AlexNet用于发票识别,针对实际中遇到的破损发票的识别率以及提高识别方法的泛化性和鲁棒性。
[0022]参见图1,本专利技术一种污损发票识别方法,包括以下步骤:
[0023]步骤1,获得破损发票数据集,并经过预处理切割出发票关键部分图像信息,将图像统一到相同的224*224大小尺寸。
[0024]步骤2,对发票数据集不平衡问题的处理:设计对抗神经网络模型,对数据集中少量的一方进行训练,然后利用训练好的生成网络生成与训练数据服从近似分布的新样本,扩增少量的样本;具体的对抗神经网络模型包括生成器和判别器的设计,生成器以随机噪音作为输入,输出三通道伪发票特征图像,判别器以真实人脸图像和生成器生成的伪人脸图像为输入,输出是0或1的概率,分别代表真实图像或假图像;对抗神经网络在训练时的最终目的是使判别网络无法判断生成网络的输出结果是否真实,训练过程结束后,可用生成器模型进行样本生成。
[0025]步骤3,在AlexNet网络的第四层后增加一层通道洗牌卷积层 (channe1shuffle),经过channel shuffle之后,输出的卷积特征由不同通道特征组合起来,增加了每组卷积层的多样性特征,提升网络特征提取能力增强网络的泛化能力和鲁棒性。
[0026]步骤4:在AlexNet网络第三层和第四层之间增加了一个卷积核大小为1
×ꢀ
1的卷积层,来加快模型运行速度和提升网络性能。
[0027]步骤5:经过第一层卷积和池化后的特征向量数量是最多的,在这一层加入 SE模
块,一组特征在上一层被输出,这时候分两条路线,第一条直接通过,第二条首先进行Squeeze操作(Global Average Pooling),把每个通道2维的特征压缩成一个1维,从而得到一个特征通道向量(每个数字代表对应通道的特征) 然后进行Excitation操作,把这一列特征通道向量输入两个全连接层和sigmoid,建模出特征通道间的相关性,得到的输出其实就是每个通道对应的权重,把这些权重通过Scale乘法通道加权到原来的特征上(第一条路),这样就完成了特征通道的权重分配,提取更有用的特征,提高网络正确率。
[0028]步骤6:针对修改后的迁移模型,在平衡后的人脸数据集上进行后面全连接层的训练,得到训练好的小样本人脸识别模型;训练过程包括前向传播过程和反向传播的过程。具体地反向传播包括更新参数的梯度下降算法和正则化损失函数作为反向更新的目标函数。
[0029]步骤7:预测:将在目标数据集上训练好的AlexNet识别模型应用到新的测试目标数据集上,输出预测结果。
[0030]下面通过一个具体的实施例对本专利技术进行详细说明:
[0031]步骤1,实际采集破损发票数据集,收集了108张有污损的增值税发票,用于测试卷积神经网络对数字识别的准确率,总共有3946个数字,汉字金额235 本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种污损发票识别方法,包括以下步骤:步骤1,获得并预处理破损发票数据集;步骤2,处理破损发票数据集的不平衡问题,设计对抗神经网络模型,对数据集中少量的一方进行训练,然后利用训练好的生成网络生成与训练数据服从近似分布的新样本;步骤3,搭建卷积神经网络经典网络模型AlexNet作为特征提取器;步骤4,在AlexNet网络的第四层卷积层后增加一层通道洗牌卷积层;步骤5,在AlexNet网络第三层卷积层和第四层卷积层之间增加一个1
×
1卷积;步骤6,在AlexNet网络第一层卷积层和池化层之后加入SE模块进行特征通道的权重分配,提取更有用的特征,提高网络正确率;步骤7,训练:用扩充后的发票数据集作为样本库训练改进的AlexNe...

【专利技术属性】
技术研发人员:宋晓茹成思齐任盼飞王婧杨佳李彤晖
申请(专利权)人:西安工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1