一种自动查验电子发票的方法及系统技术方案

技术编号:22566496 阅读:54 留言:0更新日期:2019-11-16 12:38
本发明专利技术涉及一种自动查验电子发票的方法,包括:S1、建立电子发票中各发票要素特征库;S2、预校验电子发票;S3、提取电子发票文件的文本;S4、解析发票要素;S5、将从电子发票二维码中获取发票要素值和解析得到的相应的发票要素值进行比对;S6、将解析出的发票要素值提交给全国增值税发票查验平台进行查验;S7、将从电子发票解析出的电子发票要素值与查验结果中的同名发票要素值逐一比对,如果比对的发票要素的值都完全一致,则查验成功,输出校验成功的结果并结束本次操作;如果比对的发票要素的值不一致,则查验失败,输出与税局比对不符的结果信息,并结束本次操作。本发明专利技术还公开了自动查验电子发票的系统。

A method and system of checking electronic invoice automatically

The invention relates to a method for automatically checking the electronic invoice, including: S1, establishing the characteristic database of each invoice element in the electronic invoice; S2, pre checking the electronic invoice; S3, extracting the text of the electronic invoice file; S4, analyzing the invoice element; S5, comparing the value of the invoice element obtained from the two-dimensional code of the electronic invoice with the value of the corresponding invoice element obtained from the analysis; S6, analyzing the The invoice element value shall be submitted to the national VAT invoice inspection platform for inspection; S7. The electronic invoice element value parsed from the electronic invoice shall be compared with the same name invoice element value in the inspection result one by one. If the compared invoice element values are completely consistent, the inspection is successful, the verification result is output and the operation is ended; if the compared invoice element values are inconsistent , the inspection fails, outputs the result information inconsistent with the tax bureau's comparison, and ends the operation. The invention also discloses a system for automatically checking an electronic invoice.

【技术实现步骤摘要】
一种自动查验电子发票的方法及系统
本专利技术涉及电子发票领域,具体是一种自动查验电子发票的方法及系统。
技术介绍
随着电子发票的迅速推广,电子发票在电商、电信、餐饮、酒店、交通等领域的应用日益广泛,这些电子发票都以PDF文件的形式分发到消费者和企业手中,由于电子文件易于复制、修改方便、容易被伪造等特点,相对于纸质发票,电子发票的真实性查验显得更为重要和迫切。为解决增值税发票(含电子发票)的查验,国家税务总局建立了全国增值税发票查验平台,该平台提供全国范围内一年内开具的增值税发票的查验。在该平台上,查验者输入发票代码、发票号码、开票日期、校验码(增值税普票、电子发票)或开票金额(增值税专票)即可以调取出对应的发票信息,然后查验者通过对平台提供的发票信息和待查验发票的发票信息进行人工比对,获取发票查验结果。基于全国增值税发票查验平台,部分方案进行了二次优化,支持扫描发票中的二维码将进行查验,由于发票中的二维码包括查验平台所需信息,此方案只是一个简化了输入的查验方案,仍然需要人工进行发票内容的比对。由于电子发票中二维码的识别率远高于纸质发票二维码,因此扫码查验在电子发票的查验中应用尤为广泛。上述查验方案的问题是它们实际上只提供了一个利用发票代码、发票号码等发票标识数据进行发票数据调取,然后由人工进行比对,并没有真正完成查验工作。这类方案在查验时将电子发票和纸质发票同等对待,没有考虑电子发票的各发票要素内容是可以通过电子发票PDF文件的内容进行解析,从而实现发票内容的自动比对。除上述发票查验方案外,有的查验方案提供了基于PDF版式文件模板进行发票解析,版式文件模板包含了各要素在PDF中的位置,然后通过提取电子发票PDF文件中相应位置的文字进行各发票要素的解析,然后利用解析出的要素进行查验。本方案的问题是对电子发票PDF文件样式的依赖,虽然国税总局提供了电子发票的样式规范,但各电子发票厂商在实现时不可避免地有不同程度的偏差,有的偏差已经使得基于位置的发票解析会发生严重的错漏,从而导致查验失败。另一方面,基于模板对电子发票PDF文件进行查验缺乏对PDF文件本身的预校验过程,无法快速识别伪造的电子发票PDF文件,导致大量无效的查验操作,并容易受到Does攻击。再次,因为电子发票的PDF文件生成过程是在开票软件将发票信息上传到国税局之后,由电子发票服务平台自行生成。部分电子发票服务平台因为隐私保护等原因可能会在电子发票PDF生成时将电子发票的非关键数据进行隐藏或调整,从而导致电子发票PDF显示的发票要素数据和发票底账库的数据有所差别,因此,强行要求待查验发票的所有要素与国税总局底账库一致在这类发票的查验上会导致查验失败。最后,现有电子发票的查验只是提供了查验是否成功的结论,没有形成可视化的报告,对于会计核算等要求原始凭证的应用,需要查验人自行从查验平台截屏,生成一个可供后续使用的凭证,这都为人们查验发票的工作带来了不便,而且也效率低下。
技术实现思路
本专利技术的第一个目的在于提供一种自动查验电子发票的方法,以解决上述
技术介绍
中提出的问题。本专利技术的第二个目的在于提供了一种自动查验电子发票的系统。为实现上述目的,本专利技术提供如下技术方案:一种自动查验电子发票的方法,具体步骤如下:S1、建立电子发票中各发票要素特征库,其中:所述发票要素特征库包括电子发票中所有发票要素特征;发票要素是指电子发票中具有独立含义、用于描述发票的数据项;所述发票要素特征是指发票要素值或其上下文所具有的,与其他发票要素值相区别的独有特征,发票要素特征包括发票要素值的文本特征及符合特征的文本出现次数、发票要素在电子发票文本中的特有先导词及该先导词的出现次数;S2、预校验电子发票,对电子发票文件进行预校验,若通过预校验,则提取电子发票二维码中的发票要素值,该发票要素值包括发票代码、发票号码、开票日期、校验码、合计金额值,然后进入步骤S3,若未通过预校验,则输出非发票文件的结果并结束本次操作;S3、提取电子发票文件的文本,按照从上到下、从左到右的顺序提取出电子发票文件中的所有文本;S4、解析发票要素,根据特征库中每个发票要素特征,从电子发票文本中提取出符合发票要素特征的文本,生成各发票要素值,其中:各发票要素值包括发票代码、发票号码、开票日期、校验码、合计金额值;S5、将步骤S2从电子发票二维码中获取的发票代码、发票号码、开票日期、校验码、合计金额值和步骤S4解析得到的发票要素值中的发票代码、发票号码、开票日期、校验码、合计金额值进行比对,如果其中有发票要素值不一致,则输出电子发票校验失败的结果并结束本次操作,如果比对成功,则进入步骤S6;S6、将步骤S4解析出的电子发票的发票代码、发票号码、开票日期、校验码值提交给全国增值税发票查验平台进行查验,解析查验平台返回的查验结果,如果解析结果中包含查验失败的结果信息,则输出查验失败的结果信息并结束本次操作,如果解析结果中包含查验成功的结果信息,则进一步解析出返回结果中的各发票要素值,然后进入步骤S7;S7、根据预设的需比对的发票要素,将步骤S4从电子发票解析出的电子发票要素值与步骤S6中查验结果中的同名发票要素值逐一比对,如果比对的发票要素的值都完全一致,则查验成功,输出校验成功的结果并结束本次操作;如果比对的发票要素的值不一致,则查验失败,输出与税局比对不符的结果信息,并结束本次操作。进一步地,还包括步骤S8,将步骤S6解析出的查验失败的结果信息或查验平台返回结果中的发票要素值注入预先定义的模板,生成查验结果图;然后将电子发票文件、查验结果图、步骤S2、S5、S7生成的查验结果、当前时间注入预先定义的查验报告模板,生成一个可视化的查验报告文件。进一步地,在步骤S4完成后,还要对发票商品行进行解析,然后再进入步骤S5,其中:所述商品行信息,包括商品名称、金额、税额和税率。更进一步地,在对发票商品行进行解析完成后,还需要验证发票要素关系,其中:验证发票要素关系包括:根据发票要素关系进行发票要素校验,如果校验失败,则输出查验失败信息并结束本次操作,如果校验成,则进入步骤S5。一种自动查验电子发票的系统,包括以下模块:发票要素特征库建立模块,建立电子发票中各发票要素特征库,其中:所述发票要素特征库包括电子发票中所有发票要素特征;发票要素特征包括发票要素值的文本特征及符合特征的文本出现次数、发票要素在电子发票文本中的特有先导词及该先导词的出现次数;电子发票预校验模块,对电子发票文件进行预校验,若通过预校验,则提取电子发票二维码中的发票要素值,该发票要素值包括发票代码、发票号码、开票日期、校验码、合计金额值,然后进入文本提取模块,若未通过预校验,则输出非发票文件的结果并结束本次操作;文本提取模块,提取电子发票文件的文本,按照从上到下、从左到右的顺序提取出电子发票文件中的所有文本;发票要素解析模块,解析发本文档来自技高网
...

【技术保护点】
1.一种自动查验电子发票的方法,其特征在于,具体步骤如下:/nS1、建立电子发票中各发票要素特征库,其中:/n所述发票要素特征库包括电子发票中所有发票要素特征;/n发票要素是指电子发票中具有独立含义、用于描述发票的数据项;/n所述发票要素特征是指发票要素值或其上下文所具有的,与其他发票要素值相区别的独有特征,发票要素特征包括发票要素值的文本特征及符合特征的文本出现次数、发票要素在电子发票文本中的特有先导词及该先导词的出现次数;/nS2、预校验电子发票,对电子发票文件进行预校验,若通过预校验,则提取电子发票二维码中的发票要素值,该发票要素值包括发票代码、发票号码、开票日期、校验码、合计金额值,然后进入步骤S3,若未通过预校验,则输出非发票文件的结果并结束本次操作;/nS3、提取电子发票文件的文本,按照从上到下、从左到右的顺序提取出电子发票文件中的所有文本;/nS4、解析发票要素,根据特征库中每个发票要素特征,从电子发票文本中提取出符合发票要素特征的文本,生成各发票要素值,其中:/n各发票要素值包括发票代码、发票号码、开票日期、校验码、合计金额值;/nS5、将步骤S2从电子发票二维码中获取的发票代码、发票号码、开票日期、校验码、合计金额值和步骤S4解析得到的发票要素值中的发票代码、发票号码、开票日期、校验码、合计金额值进行比对,如果其中有发票要素值不一致,则输出电子发票校验失败的结果并结束本次操作,如果比对成功,则进入步骤S6;/nS6、将步骤S4解析出的电子发票的发票代码、发票号码、开票日期、校验码值提交给全国增值税发票查验平台进行查验,解析查验平台返回的查验结果,如果解析结果中包含查验失败的结果信息,则输出查验失败的结果信息并结束本次操作,如果解析结果中包含查验成功的结果信息,则进一步解析出返回结果中的各发票要素值,然后进入步骤S7;/nS7、根据预设的需比对的发票要素,将步骤S4从电子发票解析出的电子发票要素值与步骤S6中查验结果中的同名发票要素值逐一比对,如果比对的发票要素的值都完全一致,则查验成功,输出校验成功的结果并结束本次操作;如果比对的发票要素的值不一致,则查验失败,输出与税局比对不符的结果信息,并结束本次操作。/n...

【技术特征摘要】
1.一种自动查验电子发票的方法,其特征在于,具体步骤如下:
S1、建立电子发票中各发票要素特征库,其中:
所述发票要素特征库包括电子发票中所有发票要素特征;
发票要素是指电子发票中具有独立含义、用于描述发票的数据项;
所述发票要素特征是指发票要素值或其上下文所具有的,与其他发票要素值相区别的独有特征,发票要素特征包括发票要素值的文本特征及符合特征的文本出现次数、发票要素在电子发票文本中的特有先导词及该先导词的出现次数;
S2、预校验电子发票,对电子发票文件进行预校验,若通过预校验,则提取电子发票二维码中的发票要素值,该发票要素值包括发票代码、发票号码、开票日期、校验码、合计金额值,然后进入步骤S3,若未通过预校验,则输出非发票文件的结果并结束本次操作;
S3、提取电子发票文件的文本,按照从上到下、从左到右的顺序提取出电子发票文件中的所有文本;
S4、解析发票要素,根据特征库中每个发票要素特征,从电子发票文本中提取出符合发票要素特征的文本,生成各发票要素值,其中:
各发票要素值包括发票代码、发票号码、开票日期、校验码、合计金额值;
S5、将步骤S2从电子发票二维码中获取的发票代码、发票号码、开票日期、校验码、合计金额值和步骤S4解析得到的发票要素值中的发票代码、发票号码、开票日期、校验码、合计金额值进行比对,如果其中有发票要素值不一致,则输出电子发票校验失败的结果并结束本次操作,如果比对成功,则进入步骤S6;
S6、将步骤S4解析出的电子发票的发票代码、发票号码、开票日期、校验码值提交给全国增值税发票查验平台进行查验,解析查验平台返回的查验结果,如果解析结果中包含查验失败的结果信息,则输出查验失败的结果信息并结束本次操作,如果解析结果中包含查验成功的结果信息,则进一步解析出返回结果中的各发票要素值,然后进入步骤S7;
S7、根据预设的需比对的发票要素,将步骤S4从电子发票解析出的电子发票要素值与步骤S6中查验结果中的同名发票要素值逐一比对,如果比对的发票要素的值都完全一致,则查验成功,输出校验成功的结果并结束本次操作;如果比对的发票要素的值不一致,则查验失败,输出与税局比对不符的结果信息,并结束本次操作。


2.根据权利要求1所述的一种自动查验电子发票的方法,其特征在于,还包括步骤S8,将步骤S6解析出的查验失败的结果信息或查验平台返回结果中的发票要素值注入预先定义的模板,生成查验结果图;然后将电子发票文件、查验结果图、步骤S2、S5、S7生成的查验结果、当前时间注入预先定义的查验报告模板,生成一个可视化的查验报告文件。


3.根据权利要求1所述的一种自动查验电子发票的方法,其特征在于,在步骤S4完成后,还要对发票商品行进行解析,然后再进入步骤S5,其中:
所述商品行信息,包括商品名称、金额、税额和税率。


4.根据权利要求3所述的一种自动查验电子发票的方法,其特征在于,在对发票商品行进行解析完成后,还需要验证发票要素关系,其中:验证发票要素关系包括:
根据发票要素关系进行发票要素校验,如果校验失败,则输出查验失败信息并结束本次操作,如果校验成,则进入步骤S5。...

【专利技术属性】
技术研发人员:夏子国王绪胜陈雪原张启峰安云生吴俊飞张鹏李国权聂广楠刘蕾刘宁姚涛
申请(专利权)人:北京中海汇银财税服务有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利