一种虚开增值税发票的预警分析方法及系统技术方案

技术编号:19057381 阅读:39 留言:0更新日期:2018-09-29 12:16
本发明专利技术公开了一种虚开增值税发票的预警分析方法及系统,该方法主要包括以下步骤:数据采集与处理,企业工商信息分析,企业银行交易信息分析,企业开票信息分析,反虚开预警分析结果展示。该系统主要包括数据采集与处理模块、企业工商信息分析模块、企业银行交易信息分析模块、企业开票信息分析模块、分析结果展示模块。使用本发明专利技术的虚开增值税发票的预警分析方法及系统,不但可以避开漫无目的的涉公银行账号交易信息调取,而且利用大数据平台的分布式存储、分布式计算能力,可以对涉及的大量数据进行综合存储、分析,其具备的扩展性还可以在发现新的线索时,快速扩展预警研判算法,不仅可以提高分析结果的准确性,还能降低统计分析时间。

【技术实现步骤摘要】
一种虚开增值税发票的预警分析方法及系统
本专利技术涉及企业预警分析领域,更具体地,涉及一种虚开增值税发票的预警分析方法及系统。
技术介绍
增值税是我国1994年开始全面实施的新税种,它对于减少税收环节,合理征税,促进税收具有十分重要的意义。近年来,虚开增值税专用发票的犯罪活动十分猖獗,审判实践中,对虚开增值税专用发票罪的认定存在诸多问题。虚开是指行为人违反有关发票开具管理的规定、不按照实际情况如实开具增值税专用发票及其他可用于骗取出口退税、抵扣税款的发票之行为,从广义上讲,一切不如实出具发票的行为、都是虚开的行为。狭义的虚开,则是指对发票能反映纳税人纳税情况、数额的有关内容作不实填写致使所开发票的税款与实际缴纳不符的一系列之行为。为了骗取税款,虚开增值税专用发票或用于骗取出口退税、抵扣税款的其他发票的行为就是违反了发票管理制度,同时虚开增值税专用发票或用于骗取出口退税、抵扣税款的其他发票、可以抵扣大量税款,造成国家税款的大量流失。随着社会的发展,虚开增值税发票的经济犯罪活动的形态呈现出升级化、产业化、网络化的新特点,面对形势更加严峻,预警发现难、精准打击难、遏制犯罪难等现象更加凸显,成为一个难点、难题。虚开增值税发票会有显著的资金回流特点,即虚开增值税发票行为中的资金会通过多个账号、多种渠道回到原始起点。传统的虚开增值税检测即是检测银行账户中资金的往来,判断资金往来是否形成了环路来进行反虚开预警。在后文中,我们将以虚开来指代虚开增值税发票。但是在这个过程中会遇到数据问题,即无法拿到所有的银行账目往来,所以进行账目往来环路检测的想法虽好,但如无根之萍,无法实现。为了克服环路检测的不足,总结虚开的特点会发现除了资金回流外,还具有如下特点:1、犯罪地域特性,即向外不实开具增值税发票的公司股东、法人具有明显的地域集聚特性,同时公司股东不存在非自然人;2、所开发票资金会通过对公账户在短时间内流向个人账号或对公账户,且有一定幅度的资金截留;3、公司注册地大多为住户,少有正规的写字楼等商用区域;4、所开具的发票为万元版或十万元版,且大多顶格开具。因此,基于以上特点,设计一种预警分析方法,利用大数据平台,来对企业的工商信息库、人口信息库、区域GIS信息库、嫌疑企业的开票信息、嫌疑企业的银行账目信息进行综合研判分析,以寻找具有作案嫌疑的企业,从而为反虚开进行预警,就成为了本领域技术人员亟待解决的技术问题。
技术实现思路
有鉴于此,本专利技术提供了一种虚开增值税发票的预警分析方法及系统,以解决现有技术中的问题。本专利技术公开了一种虚开增值税发票的预警分析方法,包括:数据采集与处理,将不同来源、存储格式的企业信息数据,通过数据仓库技术中的ETL工具抽取导入到大数据平台Hbase,并在抽取过程中完成数据清理工作,数据清理工作包括剔除关键信息缺失数据、重复数据;企业工商信息分析,利用分布式系统Hadoop平台的分布式计算能力,批量分析已导入的企业信息数据;批量分析过程包括提取企业法人、企业股东的常驻地和籍贯所在地,如果常驻地和籍贯所在地中的任意一者属于涉案高发区,则认为有涉案风险;再利用警用地理信息系统PGIS对企业注册所在地进行分析,如果企业注册所在地属于住宅或其它设定的可疑范围,则对该企业进行加权;企业银行交易信息分析,根据企业工商信息分析的结果,从银行获取嫌疑企业的银行交易信息,并对银行交易信息进行分析;在对银行交易信息分析时,对每一笔入账前后的出账信息进行加和统计,如果出账趋势、总量符合关联交易模型,则识别出该笔交易信息为嫌疑交易;企业开票信息分析,根据企业银行交易信息分析的结果,对嫌疑交易的开票信息进行分析,识别连续开票、顶格开票项,并将这些条目和已完成的银行交易信息分析结果进行对比,如果在时间上满足线性关系,则进行开票加权;开票信息为企业开具的发票信息电子对账单,电子对账单包括企业开具发票的时间、金额的信息;反虚开预警分析结果展示,将上述研判分析出的嫌疑企业及其研判分析证据,包括涉案地、注册地、疑似虚开银行交易、疑似开票关联信息进行展示,方便用户的深度介入。优选的,企业信息数据的来源包括企业工商信息、银行交易信息、开票信息;企业信息数据的存储格式包括:企业工商信息以“成立日期+企业注册号+对公银行账号”为rowkey进行全信息存储;银行交易信息以“银行账号+交易类型+交易时间”为rowkey进行全信息存储;开票信息以“购方识别号+开票日期+金额”为rowkey进行全信息存储。进一步优选的,企业工商信息分析包括:利用分布式系统Hadoop平台的MapReduce技术,分布式计算碰撞企业股东、企业法人的常驻地和籍贯所在地,如有任何一人的常驻地或籍贯所在地符合设定的涉案区域,则将其存储到以企业注册号为Key的键值对FXKQY<企业注册号,股东及法人信息、权值>;其中初始的权值为0,并将计算分析结果FXKQY写入到Hadoop的文件系统Hdfs中;当涉案区域分析完毕后,再次利用MapReduce技术,分布式遍历FXKQY中的企业,并将其企业注册地通过地理信息系统进行GIS信息关联对比,如果其注册所在地为住宅、集中公共注册地、重点关注地中的任意一种,则对其权值+1;分析完毕后的FXKQY重新写入到Hadoop的文件系统Hdfs中,供后续步骤利用。进一步优选的,企业银行交易信息分析包括:遍历FXKQY企业中的涉公账号,分析其银行交易信息,如果在两个交易日内的,有一笔交易的入账满足:则认为该笔交易有虚开交易嫌疑,并将FXKQY对应的权值加1;其中,n为入账信息两个交易日内的所有出账交易条数,k为出账交易金额;然后将符合条件的嫌疑交易信息保存到以企业注册号为Key的键值对FXKTRADE<企业注册号,交易编码1、关联交易编码1、交易时间1;交易编码n、关联交易编码n、交易时间n>中。进一步优选的,企业开票信息分析包括:遍历FXKTRADE,并将其嫌疑交易的入账信息和该嫌疑交易的开票信息进行比对,如果开票金额为一万元版以及十万元版连续顶格开具,则视该票有虚开嫌疑,将开票信息保存到以企业注册号为Key的键值对FXKKP<企业注册号,发票代码1、开票时间1、交易金额1;发票代码n、开票时间n、交易金额n>中,并将FXKQY对应的权值加1。至此所有的预警分析计算过程完毕。另一方面,本专利技术还公开了一种虚开增值税发票的预警分析系统,包括数据采集与处理模块、企业工商信息分析模块、企业银行交易信息分析模块、企业开票信息分析模块、分析结果展示模块;数据采集与处理模块,用于通过数据仓库技术中的ETL工具将不同来源、存储格式的企业信息数据抽取导入到大数据平台Hbase,并在抽取过程中完成数据清理工作;企业工商信息分析模块,用于利用分布式系统Hadoop平台的分布式计算能力,批量分析已导入的企业信息数据;企业银行交易信息分析模块,用于根据企业工商信息分析模块分析的结果,从银行获取嫌疑企业的银行交易信息,并对银行交易信息进行分析;企业开票信息分析模块,用于根据企业银行交易信息分析模块的分析结果,对嫌疑交易的开票信息进行分析,识别连续开票、顶格开票项,并将这些条目和已完成的银行本文档来自技高网
...

【技术保护点】
1.一种虚开增值税发票的预警分析方法,其特征在于,包括:数据采集与处理,将不同来源、存储格式的企业信息数据,通过数据仓库技术中的ETL工具抽取导入到大数据平台Hbase,并在抽取过程中完成数据清理工作,所述数据清理工作包括剔除关键信息缺失数据、重复数据;企业工商信息分析,利用分布式系统Hadoop平台的分布式计算能力,批量分析已导入的所述企业信息数据;所述批量分析过程包括提取企业法人、企业股东的常驻地和籍贯所在地,如果所述常驻地和所述籍贯所在地中的任意一者属于涉案高发区,则认为有涉案风险;再利用警用地理信息系统PGIS对企业注册所在地进行分析,如果所述企业注册所在地属于住宅或其它设定的可疑范围,则对该企业进行加权;企业银行交易信息分析,根据所述企业工商信息分析的结果,从银行获取嫌疑企业的银行交易信息,并对所述银行交易信息进行分析;在对所述银行交易信息分析时,对每一笔入账前后的出账信息进行加和统计,如果出账趋势、总量符合关联交易模型,则识别出该笔交易信息为嫌疑交易;企业开票信息分析,根据所述企业银行交易信息分析的结果,对嫌疑交易的开票信息进行分析,识别连续开票、顶格开票项,并将这些条目和已完成的银行交易信息分析结果进行对比,如果在时间上满足线性关系,则进行开票加权;所述开票信息为企业开具的发票信息电子对账单,所述电子对账单包括企业开具发票的时间、金额的信息;反虚开预警分析结果展示,将上述研判分析出的嫌疑企业及其研判分析证据,包括涉案地、注册地、疑似虚开银行交易、疑似开票关联信息进行展示,方便用户的深度介入。...

【技术特征摘要】
1.一种虚开增值税发票的预警分析方法,其特征在于,包括:数据采集与处理,将不同来源、存储格式的企业信息数据,通过数据仓库技术中的ETL工具抽取导入到大数据平台Hbase,并在抽取过程中完成数据清理工作,所述数据清理工作包括剔除关键信息缺失数据、重复数据;企业工商信息分析,利用分布式系统Hadoop平台的分布式计算能力,批量分析已导入的所述企业信息数据;所述批量分析过程包括提取企业法人、企业股东的常驻地和籍贯所在地,如果所述常驻地和所述籍贯所在地中的任意一者属于涉案高发区,则认为有涉案风险;再利用警用地理信息系统PGIS对企业注册所在地进行分析,如果所述企业注册所在地属于住宅或其它设定的可疑范围,则对该企业进行加权;企业银行交易信息分析,根据所述企业工商信息分析的结果,从银行获取嫌疑企业的银行交易信息,并对所述银行交易信息进行分析;在对所述银行交易信息分析时,对每一笔入账前后的出账信息进行加和统计,如果出账趋势、总量符合关联交易模型,则识别出该笔交易信息为嫌疑交易;企业开票信息分析,根据所述企业银行交易信息分析的结果,对嫌疑交易的开票信息进行分析,识别连续开票、顶格开票项,并将这些条目和已完成的银行交易信息分析结果进行对比,如果在时间上满足线性关系,则进行开票加权;所述开票信息为企业开具的发票信息电子对账单,所述电子对账单包括企业开具发票的时间、金额的信息;反虚开预警分析结果展示,将上述研判分析出的嫌疑企业及其研判分析证据,包括涉案地、注册地、疑似虚开银行交易、疑似开票关联信息进行展示,方便用户的深度介入。2.根据权利要求1所述的一种虚开增值税发票的预警分析方法,其特征在于,所述企业信息数据的来源包括企业工商信息、银行交易信息、开票信息;所述企业信息数据的存储格式包括:企业工商信息以“成立日期+企业注册号+对公银行账号”为rowkey进行全信息存储;银行交易信息以“银行账号+交易类型+交易时间”为rowkey进行全信息存储;开票信息以“购方识别号+开票日期+金额”为rowkey进行全信息存储。3.根据权利要求2所述的一种虚开增值税发票的预警分析方法,其特征在于,所述企业工商信息分析包括:利用分布式系统Hadoop平台的MapReduce技术,分布式计算碰撞企业股东、企业法人的常驻地和籍贯所在地,如有任何一人的常驻地或籍贯所在地符合设定的涉案区域,则将其存储到以企业注册号为Key的键值对FXKQY<企业注册号,股东及法人信息、权值>;其中初始的权值为0,并将计算分析结果FXKQY写入到Hadoop的文件系统Hdfs中;当涉案区域分析完毕后,再次利用所述MapReduce技术,分布式遍历FXKQY中的企业,并将其企业注册地通过地理信息系统进行GIS信息关联对比,如果其注册所在地为住宅、集中公共注册地、重点关注地中的任意一种,则对其权值+1;分析完毕后的FXKQY重新写入到Hadoop的文件系统Hdfs中,供后续步骤利用。4.根据权利要求3所述的一种虚开增值税发票的预警分析方法,其特征在于,所述企业银行交易信息分析包括:遍历FXKQY企业中的涉公账号,分析其银行交易信息,如...

【专利技术属性】
技术研发人员:李善宝周永利辛国茂马述杰
申请(专利权)人:泰华智慧产业集团股份有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1