一种基于发票采集系统的发票校验方法技术方案

技术编号:31801469 阅读:11 留言:0更新日期:2022-01-08 11:02
本发明专利技术公开了一种基于发票采集系统的发票校验方法,包括,采集电子发票原始文件,提取电子发票票面信息;根据提取到的电子发票票面信息对采集到的电子发票进行原始凭证校验、真伪校验;进行电子发票重复报销校验;建立发票数据池,标记发票报销状态,预先根据发票印制规格设置发票票面信息比对模板,对录入的发票进行票面内容的位置标记,结合标记进行原始凭证校验,结合发票号码进行真伪校验、重复报销校验,通过随机比对方式,节省了校验时间,且无需进行大量的数据比对,提高了重复报销校验的效率,根据校验结果建立发票池,标记发票,方便财务人员进行查询、操作,提高了人员效率,节省了人力资源,减少了管理成本。减少了管理成本。减少了管理成本。

【技术实现步骤摘要】
一种基于发票采集系统的发票校验方法


[0001]本专利技术涉及的发票采集
,尤其涉及一种基于发票采集系统的发票校验方法。

技术介绍

[0002]大部分企业由于没有严格的发票报销流程,以至于财务部门被其他部门抱怨财务混乱,财务办事效率低,报销费用不及时,日常报销费用中主要包括差旅费、电话费、交通费、办公费、购置费、业务招待费、培训费等,因此公司的财务人员可能每天都会面对着大量的需要报销的发票,在对发票进行校验时,需要人工核对发票票面上的各项信息,但是发票票面上的信息多达十余项,人工对大量的待报销发票进行逐一核对,耗费了大量的人力资源,同时财务人员需要花费大量时间进行重复性劳动,这样就会导致发票的校验效率低,而且长时间重复性劳动之后会产生疲劳,这种情况下极易出错,无形中增加管理成本。

技术实现思路

[0003]本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利技术的范围。
[0004]鉴于上述现有存在的问题,提出了本专利技术一种基于发票采集系统的发票校验方法。
[0005]因此,本专利技术解决的技术问题是:传统的发票审核校验需要耗费大量的人力资源,而且审核校验效率低下,增加了管理成本。
[0006]为解决上述技术问题,本专利技术提供如下技术方案:一种基于发票采集系统的发票校验方法,包括,
[0007]采集电子发票原始文件,提取电子发票票面信息;
[0008]根据提取到的电子发票票面信息对采集到的电子发票进行原始凭证校验、真伪校验;
[0009]进行电子发票重复报销校验;
[0010]建立发票数据池,标记发票报销状态。
[0011]作为本专利技术所述的基于发票采集系统的发票校验方法的一种优选方案,其中:所述采集电子发票原始文件,提取电子发票票面信息包括:
[0012]根据发票规格预先设置发票票面各内容信息的位置,对各内容信息位置进行原始标记,通过OCR识别对电子发票原始文件影像进行预处理,并对电子发票原始文件影像进行识别,提取采集到的电子发票原始文件影像的发票票面内容信息,并对所述发票票面内容信息的位置进行后期标记,所述电子发票票面信息还包括票面长度、票面宽度、字高、字宽、字体间距、发票代码、发票号码。
[0013]作为本专利技术所述的基于发票采集系统的发票校验方法的一种优选方案,其中:所
述原始凭证校验包括:
[0014]所述发票票面内容信息的位置标记为矩形框,获取N组后期标记,并进一步确定所述后期标记的中心点,所述中心点的数量为N,随机选取M个中心点,1<M<N,并根据中心点所对应的票面内容信息获取相应的原始标记的位置信息,计算选取的中心点两两之间的距离,并计算所述距离与对应的原始标记中心点两两之间的原始距离的差值,所述差值为{L1、L2、L3、

、L
m
‑1、L
m
},进一步对所述差值进行平均值计算,所述平均值为第一差值平均值,当所述第一差值平均值大于等于第一预设值时,所述原始凭证校验失败。
[0015]作为本专利技术所述的基于发票采集系统的发票校验方法的一种优选方案,其中:所述原始凭证校验还包括:
[0016]进一步获取所述票面长度D0、票面宽度W0、字高H、字宽W1、字体间距D1,计算得到S1=D0×
W0、S2=H
×
W1、S3=[D1×
(n

1)+n*W1]×
H的值,其中,S1为票面面积,S2为字体面积,S3为后期标记的矩形框面积,n为一个矩形框中的文字数量,并求取S3与其各自对应的原始标记的矩形框面积的差值平均值,所述差值平均值为第二差值平均值,计算票面面积、字体面积、第二差值平均值与各自对应阈值的差值,当任一差值大于等于第二预设值时,所述原始凭证校验失败。
[0017]作为本专利技术所述的基于发票采集系统的发票校验方法的一种优选方案,其中:所述真伪校验包括:
[0018]根据各原始标记的中心点位置确定发票代码、发票号码于所述电子发票原始文件影像中的后期标记位置,对所述发票代码、发票号码进行识别获取,通过与发票查验平台进行数据交互,对所述电子发票原始文件进行真伪校验。
[0019]作为本专利技术所述的基于发票采集系统的发票校验方法的一种优选方案,其中:所述电子发票重复报销校验包括:
[0020]根据各原始标记的中心点位置确定发票号码于所述电子发票原始文件影像中的后期标记位置,提取所述发票号码内容信息,并将所述发票号码内容信息与已上传的发票号码进行比对,若比对成功,则当前为重复报销,平台进行预警。
[0021]作为本专利技术所述的基于发票采集系统的发票校验方法的一种优选方案,其中:所述电子发票重复报销校验还包括:
[0022]通过识别提取到发票号码内容信息,并按照次序对所述发票号码数字进行排序,随机获取k0个位置上的发票号码数字,其中1<k0<8,并建立发票号码数字与排序位置的对应关系,生成待比对数据集,所述待比对数据集包括发票号码数字、对应排序位置,并根据所述待比对数据集与已上传的发票号码的比对结果,判断当前是否为重复报销。
[0023]作为本专利技术所述的基于发票采集系统的发票校验方法的一种优选方案,其中:所述电子发票重复报销校验还包括:
[0024]根据待比对数据集中的对应排序位置于已上传的发票号码中获取相应排序位置处的发票号码数字,并将其与所述待比对数据集中的对应排序位置的发票号码数字进行比对,比对k0次,若任一次比对失败,则当前不为重复报销,若k0次比对成功,则随机获取剩余位置中的k1个位置上的发票号码数字,其中,k1=k0或k1≠k0,且1<k1≤8

k0,并建立发票号码数字与排序位置的对应关系,生成待比对数据集,比对k1次,若任一次比对失败,则当前不为重复报销,若k1次比对成功,则随机获取剩余位置中的k
i
个位置上的发票号码数字,其
中,1<k
i
≤8

(k0+k1),再次进行比对。
[0025]作为本专利技术所述的基于发票采集系统的发票校验方法的一种优选方案,其中:所述电子发票重复报销校验还包括:
[0026]当k0+k1+

+k
i
=8时,则当前重复报销校验比对结束,根据ki次的比对结果确定当前是否为重复报销,若ki次中存在至少一次比对失败,则当前不为重复报销,若ki皆比对成功,则当前为重复报销;
[0027]当k0+k1+

+k
i
<8时,则当前继续重复报销校验比对,若ki次中至少存在一次比对失败,则当前不为重复报销,若ki皆比对成功,则继续随机获取剩余位置中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于发票采集系统的发票校验方法,其特征在于:包括,采集电子发票原始文件,提取电子发票票面信息;根据提取到的电子发票票面信息对采集到的电子发票进行原始凭证校验、真伪校验;进行电子发票重复报销校验;建立发票数据池,标记发票报销状态。2.根据权利要求1所述的基于发票采集系统的发票校验方法,其特征在于:所述采集电子发票原始文件,提取电子发票票面信息包括:根据发票规格预先设置发票票面各内容信息的位置,对各内容信息位置进行原始标记,通过OCR识别对电子发票原始文件影像进行预处理,并对电子发票原始文件影像进行识别,提取采集到的电子发票原始文件影像的发票票面内容信息,并对所述发票票面内容信息的位置进行后期标记,所述电子发票票面信息还包括票面长度、票面宽度、字高、字宽、字体间距、发票代码、发票号码。3.根据权利要求2所述的基于发票采集系统的发票校验方法,其特征在于:所述原始凭证校验包括:所述发票票面内容信息的位置标记为矩形框,获取N组后期标记,并进一步确定所述后期标记的中心点,所述中心点的数量为N,随机选取M个中心点,1<M<N,并根据中心点所对应的票面内容信息获取相应的原始标记的位置信息,计算选取的中心点两两之间的距离,并计算所述距离与对应的原始标记中心点两两之间的原始距离的差值,所述差值为{L1、L2、L3、

、L
m
‑1、L
m
},进一步对所述差值进行平均值计算,所述平均值为第一差值平均值,当所述第一差值平均值大于等于第一预设值时,所述原始凭证校验失败。4.根据权利要求3所述的基于发票采集系统的发票校验方法,其特征在于:所述原始凭证校验还包括:进一步获取所述票面长度D0、票面宽度W0、字高H、字宽W1、字体间距D1,计算得到S1=D0×
W0、S2=H
×
W1、S3=[D1×
(n

1)+n*W1]
×
H的值,其中,S1为票面面积,S2为字体面积,S3为后期标记的矩形框面积,n为一个矩形框中的文字数量,并求取S3与其各自对应的原始标记的矩形框面积的差值平均值,所述差值平均值为第二差值平均值,计算票面面积、字体面积、第二差值平均值与各自对应阈值的差值,当任一差值大于等于第二预设值时,所述原始凭证校验失败。5.根据权利要求4所述的基于发票采集系统的发票校验方法,其特征在于:所述真伪校验包括:根据各原始标记的中心点位置确定发票代码、发票号码于所述电子发票原始文件影像中的后期标记位置,对所述发票代码、发票号码进行识别获取,通过与发票查验平台进行数据交互,对所述电子发票原始文件进行真伪校验。6.根据权利要求5所述的基于发票采集系统的发票校验方法,其特征在于:所述电子发票重复报销校验包括:根据各原始标记的中心点位置确定发票号码于所述电子发票原始文件影像中的后期标记位置,提取所述...

【专利技术属性】
技术研发人员:张盛张辉张敏王晓王熹李科维张晓雪
申请(专利权)人:贵州电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1