一种财务票据识别方法及系统技术方案

技术编号:38096647 阅读:14 留言:0更新日期:2023-07-06 09:11
本发明专利技术公开了一种财务票据识别方法,包括:获取待识别的财务票据图像;对财务票据图像进行预处理得到处理后的图像;构建改进型YOLO

【技术实现步骤摘要】
一种财务票据识别方法及系统


[0001]本专利技术涉及票据识别
,具体涉及一种财务票据识别方法及系统。

技术介绍

[0002]票据是记录商品或服务交易经济行为的一种重要凭证。随着社会经济的发展,票据的重要性越来越被人们重视,发票作为经济活动的信息载体,是财务工作人员重点整理对象。电子发票的出现给工作带来许多便捷的同时也给财务管理工作人员带来挑战。
[0003]财务工作人员在处理发票的过程中,发票进行手工建档劳动强度高,而且容易出错,工作效率极低。财务工作人员需要认真的阅读发票内容,并将需要提取整理归档的内容进行人工录入,人工录入信息工作成本代价高效率低且容易出错。

技术实现思路

[0004]针对现有技术中的缺陷,本专利技术提供的一种财务票据识别方法及系统,能准确地从票据图像上自动提取文字信息,提高了票据识别结果的准确性,极大地节约了人工成本。
[0005]第一方面,本专利技术实施例提供的一种财务票据识别方法,包括:
[0006]获取待识别的财务票据图像;
[0007]对所述财务票据图像进行预处理得到处理后的图像;
[0008]构建改进型YOLO

v3模型;
[0009]采用构建好的改进型YOLO

v3模型对处理后的图像进行感兴趣区域定位,并提取出感兴趣区域的坐标位置,根据坐标位置裁剪出目标图片;
[0010]将目标图片进行文本分割得到分割后的图片;
[0011]采用CRNN网络模型对分割后的图片进行文本识别,得到票据识别结果。
[0012]第二方面,本专利技术实施例提供的一种财务票据识别系统,包括:获取模块、预处理模块、模型构建模块、定位模块、切割模块和识别模块,
[0013]所述获取模块用于获取待识别的财务票据图像;
[0014]所述预处理模块用于对所述财务票据图像进行预处理得到处理后的图像;
[0015]所述模型构建模块用于构建改进型YOLO

v3模型;
[0016]所述定位模块采用构建好的改进型YOLO

v3模型对处理后的图像进行感兴趣区域定位,并提取出感兴趣区域的坐标位置,根据坐标位置裁剪出目标图片;
[0017]所述切割模块将目标图片进行文本分割得到分割后的图片;
[0018]所述识别模块采用CRNN网络模型对分割后的图片进行文本识别,得到票据识别结果。
[0019]本专利技术的有益效果:
[0020]本专利技术实施例提供的一种财务票据识别方法及系统,通过对财务票据进行图像预处理,降低图像噪声和校正图像方位姿态有利于后续票据信息的提取,采用改进型YOLO

v3模型进行感兴趣区域定位,提高了目感兴趣区域检测的精确度,采用CRNN网络模型进行文
字识别,有效提高了财务票据识别的准确性,极大地节约了人工成本。
附图说明
[0021]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
[0022]图1示出了本专利技术另一实施例所提供的一种财务票据识别方法的流程图;
[0023]图2示出了本专利技术第一实施例所提供的一种财务票据识别系统的结构示意图。
具体实施方式
[0024]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0025]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0026]还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0027]还应当进一步理解,本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0028]如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0029]需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本专利技术所属领域技术人员所理解的通常意义。
[0030]如图1所示,示出了本专利技术第一实施例所提供的一种财务票据识别方法的流程图,方法包括以下步骤:
[0031]S1:获取待识别的财务票据图像;
[0032]S2:对所述财务票据图像进行预处理得到处理后的图像;
[0033]S3:构建改进型YOLO

v3模型;
[0034]S4:采用构建好的改进型YOLO

v3模型对处理后的图像进行感兴趣区域定位,并提取出感兴趣区域的坐标位置,根据坐标位置裁剪出目标图片;
[0035]S5:将目标图片进行文本分割得到分割后的图片;
[0036]S6:采用CRNN网络模型对分割后的图片进行文本识别,得到票据识别结果。
[0037]在本实施例中,财务票据包括增值税普通发票、增值税专用发票、增值税电子普通发票、增值税电子专用发票、火车票、出租车票、航空行程单等多种常见财务报销凭证类票
据。图像质量的好坏对后续的检测和识别有直接的影响。因此,对财务票据图像进行预处理,提高票据图像质量,降低图像中的噪声。通过建好的改进型YOLO

v3模型对处理后的图像进行感兴趣区域定位,标定出感兴趣区域,并提取其坐标位置,并裁剪出目标图片,对目标图片进行文本分割得到分割后的图片,采用CRNN网络模型对分割后的图片进行文本识别,得到票据识别结果。
[0038]通过对财务票据图像进行预处理,提高票据图像质量,有利于后续模型对票据图像的处理,采用改进型YOLO

v3模型对感兴趣区域进行定位,检测感兴趣区域,改进型YOLO

v3模型提取特征图的性能好,检测速度快。采用CRNN网络模型对分割后的图片进行文本识别,提高识别的结果的准确性。
[0039]具体地,在本专利技术提供的一种财务本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种财务票据识别方法,其特征在于,包括:获取待识别的财务票据图像;对所述财务票据图像进行预处理得到处理后的图像;构建改进型YOLO

v3模型;采用构建好的改进型YOLO

v3模型对处理后的图像进行感兴趣区域定位,并提取出感兴趣区域的坐标位置,根据坐标位置裁剪出目标图片;将目标图片进行文本分割得到分割后的图片;采用CRNN网络模型对分割后的图片进行文本识别,得到票据识别结果。2.如权利要求1所述的财务票据识别方法,其特征在于,对所述财务票据图像进行预处理得到处理后的图像的具体方法包括:对财务票据图像进行高斯滤波得到滤波后的图像;对滤波后的图像进行二值化处理得到二值化图像;对二值化图像进行边缘检测,对边缘图像进行透视变换得到校正图像;对校正图像进行方位姿态矫正得到正放的财务票据图像。3.如权利要求1所述的财务票据识别方法,其特征在于,所述构建改进型YOLO

v3模型的具体方法包括:通过darknet

53主干网络进行改进得到darknet

39主干网络模型;采用训练好的darknet

39主干网络模型提取图像特征,得到5个不同尺度卷积层的特征图;将不同尺度卷积层的特征图进行最优组合得到组合特征图;对组合特征图进行加权特征融合;采用YOLO

V3算法对融合后的特征图进行回归预测,得到定位区域。4.如权利要求3所述的财务票据识别方法,其特征在于,还包括训练darknet

39主干网络模型的步骤,训练darknet

39主干网络模型的具体方法包括:在传统的YOLO

V3算法的主干网络中增加了2个卷积层,采用5个不同尺度卷积层特征图来进行目标检测;获取数据集,将数据集划分为训练集、测试集和验证集,在训练集上采用k

means聚类算法重新聚类边界框的坐标,计算出5个不同尺度卷积层特征图的15个边界框坐标。5.如权利要求1所述的财务票据识别方法,其特征在于,所述CRNN网络模型包括CNN网络、循环网络和转录层,所述CNN网络用于提取分割后的图片的尺度不变特征形成特征图,将特征图按列进行切分形成特征序列输入到循环网络;所述循环网络由两层双向LSTM网络构成,所述循环网络用于将CNN网络输入的特征序列和分类标签相对应,输出一串有序标签序列,所述序列的子串当中就包含真实的最终结果,并将有序标签序列输入转录层;所述转录层有序标签序列进行整合操作得到识别结果。6.一种财务票据识别系统,其特征在于,包括:获取模块、预处理模块、模型构建模块、定位模块、切割模块和识别模块,所述获取模块用于获取待识别的财务票据图像;
所述预处理模块用...

【专利技术属性】
技术研发人员:张子荣
申请(专利权)人:深圳易财信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1