一种根据位置提取增值税发票信息的方法技术

技术编号：39664211 阅读：10 留言：0更新日期：2023-12-11 18:27

本发明专利技术涉及图像处理和计算机视觉技术领域，具体为一种根据位置提取增值税发票信息的方法，包括以下步骤：模板拍摄；框选模板内容区域；区域截取效果测试；目标检测提取发票区域；文本识别；文字后处理；有益效果为：本发明专利技术提出的根据位置提取增值税发票信息的方法，利用模板和坐标对应关系替代传统的文本检测模型，避免因背景

全部详细技术资料下载

【技术实现步骤摘要】
一种根据位置提取增值税发票信息的方法

[0001]本专利技术涉及图像处理和计算机视觉
，具体为一种根据位置提取增值税发票信息的方法
。

技术介绍

[0002]在税务管理和财务审计中，增值税发票是一种重要的财务凭证
。
从增值税发票中提取准确的信息对于税务机关
、
企业财务部门和审计机构等具有重要意义
。
[0003]现有技术中，传统的增值税发票信息提取方法存在一些问题
。
其中一个主要问题是，增值税发票通常具有复杂的布局和格式，发票上的信息可能以不同的字体
、
大小
、
颜色和位置呈现，传统方法通常依赖于文本检测模型来识别发票上的文字内容区域
。
这些模型往往容易受到背景
、
阴影等因素的干扰，导致提取的文字内容区域不准确，从而影响提取的准确性
。
[0004]并且，对于增值税发票上的特定字段标题
(
例如“购买方纳税人识别号”)
，传统方法通常依赖于文本检核和文字识别来确定内容
。
然而，由于自动识别的限制，可能存在识别错误的情况，从而导致提取的信息不准确
。

技术实现思路

[0005]本专利技术的目的在于提供一种根据位置提取增值税发票信息的方法，以解决上述
技术介绍
中提出的问题
。
[0006]为实现上述目的，本专利技术提供如下技术方案：一种根据位置提取增值税发票信息的方法，所述方...

【技术保护点】

【技术特征摘要】
1.
一种根据位置提取增值税发票信息的方法，其特征在于：所述方法包括以下步骤：步骤1：模板拍摄；步骤2：框选模板内容区域；步骤3：区域截取效果测试；步骤4：目标检测提取发票区域；步骤5：文本识别；步骤6：文字后处理
。2.
根据权利要求1所述的一种根据位置提取增值税发票信息的方法，其特征在于：模板拍摄的具体操作包括：拍摄一张增值税专用发票的图片，发票摆放端正
、
平整，拍摄时避免过曝
、
阴影不良情况，去掉拍摄的照片中的背景区域，使增值税发票的四个角与图片的四个角对齐，传入
python
程序
。3.
根据权利要求2所述的一种根据位置提取增值税发票信息的方法，其特征在于：框选模板内容区域的具体操作包括：使用
python
的
OpenCV
和
Matplotlib
库打开步骤1得到的图片，设图片左上角为原点，使用鼠标事件回调函数手动标记图像上的每个内容信息的区域，并将每个内容区域的坐标存储下来并以字段名称命名
。4.
根据权利要求3所述的一种根据位置提取增值税发票信息的方法，其特征在于：区域截取效果测试的具体操作包括：使用步骤2生成的模板中各字段的内容区域坐...

【专利技术属性】
技术研发人员：葛君正，陈其宾，姜凯，
申请(专利权)人：山东浪潮科学研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人