本发明专利技术涉及图像处理和计算机视觉技术领域,具体为一种根据位置提取增值税发票信息的方法,包括以下步骤:模板拍摄;框选模板内容区域;区域截取效果测试;目标检测提取发票区域;文本识别;文字后处理;有益效果为:本发明专利技术提出的根据位置提取增值税发票信息的方法,利用模板和坐标对应关系替代传统的文本检测模型,避免因背景
【技术实现步骤摘要】
一种根据位置提取增值税发票信息的方法
[0001]本专利技术涉及图像处理和计算机视觉
,具体为一种根据位置提取增值税发票信息的方法
。
技术介绍
[0002]在税务管理和财务审计中,增值税发票是一种重要的财务凭证
。
从增值税发票中提取准确的信息对于税务机关
、
企业财务部门和审计机构等具有重要意义
。
[0003]现有技术中,传统的增值税发票信息提取方法存在一些问题
。
其中一个主要问题是,增值税发票通常具有复杂的布局和格式,发票上的信息可能以不同的字体
、
大小
、
颜色和位置呈现,传统方法通常依赖于文本检测模型来识别发票上的文字内容区域
。
这些模型往往容易受到背景
、
阴影等因素的干扰,导致提取的文字内容区域不准确,从而影响提取的准确性
。
[0004]并且,对于增值税发票上的特定字段标题
(
例如“购买方纳税人识别号”)
,传统方法通常依赖于文本检核和文字识别来确定内容
。
然而,由于自动识别的限制,可能存在识别错误的情况,从而导致提取的信息不准确
。
技术实现思路
[0005]本专利技术的目的在于提供一种根据位置提取增值税发票信息的方法,以解决上述
技术介绍
中提出的问题
。
[0006]为实现上述目的,本专利技术提供如下技术方案:一种根据位置提取增值税发票信息的方法,所述方法包括以下步骤:
[0007]步骤1:模板拍摄;
[0008]步骤2:框选模板内容区域;
[0009]步骤3:区域截取效果测试;
[0010]步骤4:目标检测提取发票区域;
[0011]步骤5:文本识别;
[0012]步骤6:文字后处理
。
[0013]优选的,模板拍摄的具体操作包括:
[0014]拍摄一张增值税专用发票的图片,发票摆放端正
、
平整,拍摄时避免过曝
、
阴影不良情况,去掉拍摄的照片中的背景区域,使增值税发票的四个角与图片的四个角对齐,传入
python
程序
。
[0015]优选的,框选模板内容区域的具体操作包括:
[0016]使用
python
的
OpenCV
和
Matplotlib
库打开步骤1得到的图片,设图片左上角为原点,使用鼠标事件回调函数手动标记图像上的每个内容信息的区域,并将每个内容区域的坐标存储下来并以字段名称命名
。
[0017]优选的,区域截取效果测试的具体操作包括:
[0018]使用步骤2生成的模板中各字段的内容区域坐标,对其他剪掉背景区域的增值税发票图片,使用
python
程序根据左上角坐标对所有内容区域进行截取效果测试,如果多次测试的结果准确,即内容文字完整出现在重新截取后的内容区域图片中,即可保留步骤2得到的各字段的内容区域坐标,否则,要更换模板图片重新执行步骤2,直到测试结果准确
。
[0019]优选的,目标检测提取发票区域的具体操作包括:
[0020]对于待提取的发票图片,训练一个目标检测模型,使目标检测模型在原拍摄照片中检测增值税发票的区域,即增值税发票4个角内的区域,并将区域提取出后保存,送至下一步骤中的文本识别模型
。
[0021]优选的,文本识别的具体操作包括:
[0022]根据步骤3得到的各字段的内容区域坐标和步骤4得到的处理后的待识别发票图片,将所有内容区域按照坐标信息截取出来并送入一个开源的文本识别模型,获得各区域内的中文
、
数字
、
标点字符
。
[0023]优选的,文字后处理的具体操作包括:
[0024]设定各种后处理规则,对步骤6得到的识别结果中可能存在的错误进行进一步纠正
。
[0025]与现有技术相比,本专利技术的有益效果是:
[0026]本专利技术提出的根据位置提取增值税发票信息的方法,利用模板和坐标对应关系替代传统的文本检测模型,避免因背景
、
阴影等干扰因素带来的文本检测模型提取的文字内容区域不准确的弊端,而且对于字段标题比如“购买方纳税人识别号”等因为是手动输入,所以保证不会识别错误
。
本专利技术仅通过目标检测模型和文本识别模型进行需要关注的文字内容的提取,简化提取增值税发票信息的流程,提高提取增值税发票信息的准确率
。
附图说明
[0027]图1为本专利技术方法流程图
。
具体实施方式
[0028]为了使本专利技术的目的
、
技术方案进行清楚
、
完整地描述,及优点更加清楚明白,以下结合附图对本专利技术实施例进行进一步详细说明
。
应当理解,此处所描述的具体实施例是本专利技术一部分实施例,而不是全部的实施例,仅仅用以解释本专利技术实施例,并不用于限定本专利技术实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围
。
[0029]请参阅图1,本专利技术提供一种技术方案:一种根据位置提取增值税发票信息的方法,所述方法包括以下步骤:
[0030]步骤1:模板拍摄
。
拍摄1张增值税专用发票的图片,且要求摆放端正
、
平整,拍摄时避免过曝
、
阴影等不良情况,然后去掉拍摄的照片中的背景区域,使增值税发票的四个角与图片的四个角对齐,然后传入
python
程序
。
[0031]步骤2:框选模板内容区域
。
使用
python
的
OpenCV
和
Matplotlib
库打开步骤1得到的图片,设图片左上角为原点,使用鼠标事件回调函数手动标记图像上的每个内容信息的区域,并将每个内容区域的坐标存储下来并以字段名称命名
。
比如发票上“购买方名称:
XXX
公司”这个信息中,只标记
XXX
公司可能存在的区域,并且将这个区域命名为购买方名称
。
要注意在标记内容信息可能存在的区域时,要充分考虑到字数足够多的情况下,该内容可能出现的潜在区域,比如文字足够多,会顶头或者可能分两行或多行的情况
。
而且,内容区域不必紧贴实际内容文字
。
[0032]步骤3:区域截取效果测试
。
使用步骤2生成的模板中各字段的内容区域坐标,对其他剪掉背景区域的增值税发票图片,使用
python
程序根据左上角坐标对所有内容区域进行截取效果测试,如果多次测试的结果准确
(
即内容文字完整出现在重新截取后的内本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种根据位置提取增值税发票信息的方法,其特征在于:所述方法包括以下步骤:步骤1:模板拍摄;步骤2:框选模板内容区域;步骤3:区域截取效果测试;步骤4:目标检测提取发票区域;步骤5:文本识别;步骤6:文字后处理
。2.
根据权利要求1所述的一种根据位置提取增值税发票信息的方法,其特征在于:模板拍摄的具体操作包括:拍摄一张增值税专用发票的图片,发票摆放端正
、
平整,拍摄时避免过曝
、
阴影不良情况,去掉拍摄的照片中的背景区域,使增值税发票的四个角与图片的四个角对齐,传入
python
程序
。3.
根据权利要求2所述的一种根据位置提取增值税发票信息的方法,其特征在于:框选模板内容区域的具体操作包括:使用
python
的
OpenCV
和
Matplotlib
库打开步骤1得到的图片,设图片左上角为原点,使用鼠标事件回调函数手动标记图像上的每个内容信息的区域,并将每个内容区域的坐标存储下来并以字段名称命名
。4.
根据权利要求3所述的一种根据位置提取增值税发票信息的方法,其特征在于:区域截取效果测试的具体操作包括:使用步骤2生成的模板中各字段的内容区域坐...
【专利技术属性】
技术研发人员:葛君正,陈其宾,姜凯,
申请(专利权)人:山东浪潮科学研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。