一种基于CRNN算法的发票文件真伪识别方法技术

技术编号:24357260 阅读:79 留言:0更新日期:2020-06-03 02:49
本发明专利技术公开了一种基于CRNN算法的发票扫描件真伪识别方法,首先定位发票文件中二维码所在位置,识别二维码并对接全国增值税发票查验平台获取发票的全部真实电子文本信息,提取真实关键项信息及其数值长度,同时,通过CRNN算法获取发票文件票面信息的四项票面关键项信息及其数值长度,通过真实关键项信息数值长度与其对应票面关键项信息数值长度的比对产生验真结果,若验真结果为真,将判定票据为真,若验真结果为假,则进一步符合人工复核票据真伪;本发明专利技术能够快速、简便、准确地识别投标文件中的发票真伪,识别效率高,识别准确度高,可靠度强,极大提高了评标效率及准确性,进而保证投标结果的准确性。

A method to identify the authenticity of invoice documents based on crnn algorithm

【技术实现步骤摘要】
一种基于CRNN算法的发票文件真伪识别方法
本专利技术涉及发票文件真伪识别
,尤其涉及一种基于CRNN算法的发票文件真伪识别方法。
技术介绍
在电网投标过程中,业绩作为重要评审项之一,一直以来都是影响专家评标效率和引发投标人质疑的重要因素。业绩的证明材料主要包括合同和发票,两者都具备且一一对应才被认定为有效业绩,目前多通过评标专家人工进行证明材料的审核。但是,在评标过程中经常会出现发票票面信息(包含物资名称、数量或金额等信息)被涂抹或模糊不清,存在发票造假嫌疑的情况发生,极大地影响了评标效率及准确性,而无法准确识别发票文件真伪,也给招标单位造成了巨大的经济损失及不良的社会影响。究其原因,主要包括以下几个方面:1、评标专家普遍存在不能准确查询识别发票真伪;2、人工审核操作繁琐且可靠性差,极易发生错误;3、发票制假技术与时俱进,假发票足以以假乱真,不通过税务系统查询,难以用肉眼区分。对于发票验真,目前常采用的方法多为利用网站、手机、二维码专用扫描设备或识别软件等方式获取所持有的发票信息,然后与网上税务局发票查验平台采集的发票电子信息进本文档来自技高网...

【技术保护点】
1.一种基于CRNN算法的发票文件真伪识别方法,其特征在于:包括以下步骤:/nA、采集发票文件中二维码位置信息;/nB、识别发票文件的票面信息和真实票据信息;具体包括:/n提取具有相同二维码位置信息的发票文件图像中的图像块,每个图像块对应票面一项发票单项信息,采用CRNN算法提取图像块对应的发票单项信息并构成发票文件的票面信息;/n识别发票文件中的二维码,通过联网全国增值税发票查验平台获取发票文件的真实电子文本信息,即发票文件的真实票据信息;/nC、分别提取票面信息中的N项票面关键项信息和真实票据信息中的N项真实关键项信息,票面关键项信息与真实关键项信息一一对应;/nD、将票面关键项信息的字符...

【技术特征摘要】
1.一种基于CRNN算法的发票文件真伪识别方法,其特征在于:包括以下步骤:
A、采集发票文件中二维码位置信息;
B、识别发票文件的票面信息和真实票据信息;具体包括:
提取具有相同二维码位置信息的发票文件图像中的图像块,每个图像块对应票面一项发票单项信息,采用CRNN算法提取图像块对应的发票单项信息并构成发票文件的票面信息;
识别发票文件中的二维码,通过联网全国增值税发票查验平台获取发票文件的真实电子文本信息,即发票文件的真实票据信息;
C、分别提取票面信息中的N项票面关键项信息和真实票据信息中的N项真实关键项信息,票面关键项信息与真实关键项信息一一对应;
D、将票面关键项信息的字符长度与对应真实关键项信息的字符长度一一进行比对;若N项票面关键项信息的字符长度与N项真实关键项信息的字符长度均一致,则进入步骤E;反之,则进入步骤F;
E、发票文件为真,将发票文件的真实票据信息录入本地发票数据库;
F、发票文件存疑,由人工复核发票文件真伪。


2.根据权利要求1所述的基于CRNN算法的发票文件真伪识别方法,其特征在于:步骤B中,若识别发票文件图像中的二维码后通过联网全国增值税发票查验平台无法获取发票文件的真实电子文本信息,则直接进入步骤F。


3.根据权...

【专利技术属性】
技术研发人员:薛洛良彭飞李燕张高言丁萌萌任定一韩沛魏薇张茜茜张亮杨静刘颜乐王梦
申请(专利权)人:河南电力物资有限公司
类型:发明
国别省市:河南;41

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1