【技术实现步骤摘要】
一种财务票据识别方法及系统
[0001]本专利技术涉及票据识别
,具体涉及一种财务票据识别方法及系统。
技术介绍
[0002]票据是记录商品或服务交易经济行为的一种重要凭证。随着社会经济的发展,票据的重要性越来越被人们重视,发票作为经济活动的信息载体,是财务工作人员重点整理对象。电子发票的出现给工作带来许多便捷的同时也给财务管理工作人员带来挑战。
[0003]财务工作人员在处理发票的过程中,发票进行手工建档劳动强度高,而且容易出错,工作效率极低。财务工作人员需要认真的阅读发票内容,并将需要提取整理归档的内容进行人工录入,人工录入信息工作成本代价高效率低且容易出错。
技术实现思路
[0004]针对现有技术中的缺陷,本专利技术提供的一种财务票据识别方法及系统,能准确地从票据图像上自动提取文字信息,提高了票据识别结果的准确性,极大地节约了人工成本。
[0005]第一方面,本专利技术实施例提供的一种财务票据识别方法,包括:
[0006]获取待识别的财务票据图像;
[0007]对所述财务票据图像进行预处理得到处理后的图像;
[0008]构建改进型YOLO
‑
v3模型;
[0009]采用构建好的改进型YOLO
‑
v3模型对处理后的图像进行感兴趣区域定位,并提取出感兴趣区域的坐标位置,根据坐标位置裁剪出目标图片;
[0010]将目标图片进行文本分割得到分割后的图片;
[0011]采用CRNN网络模型对分割后的图 ...
【技术保护点】
【技术特征摘要】
1.一种财务票据识别方法,其特征在于,包括:获取待识别的财务票据图像;对所述财务票据图像进行预处理得到处理后的图像;构建改进型YOLO
‑
v3模型;采用构建好的改进型YOLO
‑
v3模型对处理后的图像进行感兴趣区域定位,并提取出感兴趣区域的坐标位置,根据坐标位置裁剪出目标图片;将目标图片进行文本分割得到分割后的图片;采用CRNN网络模型对分割后的图片进行文本识别,得到票据识别结果。2.如权利要求1所述的财务票据识别方法,其特征在于,对所述财务票据图像进行预处理得到处理后的图像的具体方法包括:对财务票据图像进行高斯滤波得到滤波后的图像;对滤波后的图像进行二值化处理得到二值化图像;对二值化图像进行边缘检测,对边缘图像进行透视变换得到校正图像;对校正图像进行方位姿态矫正得到正放的财务票据图像。3.如权利要求1所述的财务票据识别方法,其特征在于,所述构建改进型YOLO
‑
v3模型的具体方法包括:通过darknet
‑
53主干网络进行改进得到darknet
‑
39主干网络模型;采用训练好的darknet
‑
39主干网络模型提取图像特征,得到5个不同尺度卷积层的特征图;将不同尺度卷积层的特征图进行最优组合得到组合特征图;对组合特征图进行加权特征融合;采用YOLO
‑
V3算法对融合后的特征图进行回归预测,得到定位区域。4.如权利要求3所述的财务票据识别方法,其特征在于,还包括训练darknet
‑
39主干网络模型的步骤,训练darknet
‑
39主干网络模型的具体方法包括:在传统的YOLO
‑
V3算法的主干网络中增加了2个卷积层,采用5个不同尺度卷积层特征图来进行目标检测;获取数据集,将数据集划分为训练集、测试集和验证集,在训练集上采用k
‑
means聚类算法重新聚类边界框的坐标,计算出5个不同尺度卷积层特征图的15个边界框坐标。5.如权利要求1所述的财务票据识别方法,其特征在于,所述CRNN网络模型包括CNN网络、循环网络和转录层,所述CNN网络用于提取分割后的图片的尺度不变特征形成特征图,将特征图按列进行切分形成特征序列输入到循环网络;所述循环网络由两层双向LSTM网络构成,所述循环网络用于将CNN网络输入的特征序列和分类标签相对应,输出一串有序标签序列,所述序列的子串当中就包含真实的最终结果,并将有序标签序列输入转录层;所述转录层有序标签序列进行整合操作得到识别结果。6.一种财务票据识别系统,其特征在于,包括:获取模块、预处理模块、模型构建模块、定位模块、切割模块和识别模块,所述获取模块用于获取待识别的财务票据图像;
所述预处理模块用...
【专利技术属性】
技术研发人员:张子荣,
申请(专利权)人:深圳易财信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。