一种发票信息提取方法及系统技术方案

技术编号：37668888 阅读：19 留言：0更新日期：2023-05-26 04:29

本发明专利技术公开了一种发票信息提取方法及系统，该方法包括：1)根据文本方向对目标发票图片进行分类；2)获取经过分类后的图片的检测区域，对检测区域取最小外接矩形并进行仿射变换；3)获取经过仿射变换后的图片的文字定位框位置且进行截图，对截图进行文字识别得到文字识别结果；4)通过文字识别结果、文字定位框位置、目标发票图片获取语义实体识别结果；5)将语义实体识别结果进行后处理得到最终结果。本发明专利技术完全基于深度学习，流程清晰，速度快，精度高，鲁棒性强。本发明专利技术可移植性强，可以轻松应用于其他票据识别上。本发明专利技术利用了文本、视觉、布局等多模态信息从而极大的提升了语义实体识别的准确率。别的准确率。别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种发票信息提取方法及系统

[0001]本专利技术涉及文本识别
，具体涉及一种发票信息提取方法及系统。

技术介绍

[0002]目前，随着AI技术的OCR文字识别的进步和日趋成熟，在财务管理领域的应用也越来越普及，尤其是在发票的处理运用上。AI技术能够根据发票的影像文件，通过OCR技术快速识别发票中的内容并形成结构化数据，发票数据的获取速度从人工的分钟级别升级到了秒级，准确率也将达到更高的水平。极大的节省了发票录入的时间，进一步推进了企业财务领域管理线上化、自动化的进程。
[0003]现有发票识别主要有以下方案：
[0004][0005]由于拍照设备的硬件、拍照时间以及拍照所处场景千差万别，导致得到的文档素材差异性较大，目前的算法在准确率和鲁棒性方面均不理想。

技术实现思路

[0006]本专利技术的目的在于克服现有技术之缺陷，提供了一种场景适应的参数化光伏组件松动检测方法，针对现有发票信息提取存在的流程较长、准确率较低、鲁棒性较差的问题，在算法流程上进行了优化，关键部分均使用深度学习算法，改善了目前算法中存在的问题。
[0007]为了到达预期效果，本专利技术采用了以下技术方案：
[0008]本专利技术公开了一种发票信息提取方法，包括：
[0009]1)根据文本方向对目标发票图片进行分类；
[0010]2)获取经过分类后的图片的检测区域，对检测区域取最小外接矩形并进行仿射变换；
[0011]3)获取经过仿射变换后的图片的文字定位框位置且进行截图...

【技术保护点】

【技术特征摘要】
1.一种发票信息提取方法，其特征在于，包括：1)根据文本方向对目标发票图片进行分类；2)获取经过分类后的图片的检测区域，对检测区域取最小外接矩形并进行仿射变换；3)获取经过仿射变换后的图片的文字定位框位置且进行截图，对截图进行文字识别得到文字识别结果；4)通过文字识别结果、文字定位框位置、目标发票图片获取语义实体识别结果；5)将语义实体识别结果进行后处理得到最终结果。2.如权利要求1所述的一种发票信息提取方法，其特征在于，通过文本方向检测模型将目标发票图片按照角度分为多种情况，且定义其中一角度为标准方向，根据分类情况将目标发票图片统一旋转至标准方向。3.如权利要求2所述的一种发票信息提取方法，其特征在于，当通过文本方向检测模型将目标发票图片按照角度分为多种情况时，在所述文本方向检测模型的骨干网络中提取不同尺寸的特征图层进行方向预测以得到预设的分类图片。4.如权利要求2或3所述的一种发票信息提取方法，其特征在于，将经过旋转的图片经过部分调整后再输入分割模型以获取经过分类后的图片的检测区域，所述部分调整具体包括：根据图片的长宽比统计特征，缩小图片尺寸，使分割模型在分割速度和精度之间达到平衡。5.如权利要求1所述的一种发票信息提取方法，其特征在于，将经过仿射变换后的图片输入文字检测模型以获取经过仿射变换后的图片的文字定位框位置且进行截图，所述文字检测模型采用基于自适应尺度融合的可微分二值化模型。6.如权利要求5所述的一种发票信息提取方法，其特征在于，所述获取经过仿射变换后的图片的文字定位框位置具体包括：在后处理上对相...

【专利技术属性】
技术研发人员：晏宇，周彭滔，邓嘉，董逢华，
申请(专利权)人：武汉天喻信息产业股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人