一种基于大数据中心的增值税发票应用分析系统技术方案

技术编号:20329888 阅读:1791 留言:0更新日期:2019-02-13 06:12
本发明专利技术提供了一种基于大数据中心的增值税发票应用分析系统,属于税务信息处理领域。本发明专利技术基于Hadoop的大数据采集、分析、处理,主要解决海量数据运算性能,数据处理时间,数据共享与应用,数据建模加工等问题。本发明专利技术能够对全票种的发票数据、征管数据和申报数据进行比对分析,实现对纳税人各类发票信息的多维展示及对各类风险点的扫描,预测发票背后企业经营行为和国民经济行业的走势,对风险疑点企业预警并建立台账发布绩效跟踪等问题,满足大量高效分析处理税票数据的要求。

【技术实现步骤摘要】
一种基于大数据中心的增值税发票应用分析系统
本专利技术属于税务信息处理领域,特别涉及一种基于大数据中心的增值税发票应用分析系统。
技术介绍
我国增值税发票的审批及办税流程滋生了一些企业借助政策“红利”虚开品名、违规抵扣进项,变更品名虚开发票,虚增产能虚开发票,多抵扣少交税,违规享受税收优惠政策,申报税额与实际开票税额不一致等问题,税务机关往往需要加强对增值税发票的后续监控管理,跟踪分析纳税人发票使用及纳税申报情况。国内对于税收信息化的研究也不断的在探索和创新,税收信息化建设化历程也与时俱进,先后经历二个阶段,一个突破,第一阶段是以CTAIS为核心的税收征管系统建设,该系统在全国各级税务机关建立了一个统一的、完整的、全面的、严密的涵盖三个应用层次,四级网络的大型应用系统。这一阶段研究方向主要体现在税收征管以及基于数据仓库技术的税收征管决策支持研究。第二阶段是以金税三期(简称金三)为主的核心征管体系建设,该体系围绕着“一个平台、两级处理、三个覆盖、四个系统”的总体目标而建立,其总体要求为:“构建以明晰征纳双方权利和业务为前提,以风险管理为导向,以专业化管理为基础,以重点税源管理为着力点,以信息化为支撑的现代化税收征管体系”。这一阶段研究的重点在依法治税及企业涉税风险分析与防范等方面。近年来,随着营改增工作的稳步推进,相关开票数据,申报数据,征收数据呈现几何级增长,尤其是以电子底账为核心的开票数据,增长效果明显,税务机关一方面要基于现有的数据量,准确的分析出各行业、各地区、各票种的发展现状,存在的短板,另一方面,要与历年数据比对,对国民经济发展情况进行环比、同比分析,预测未来经济发展趋势。同时,对于涉及税收违法行为要进行研判、预警并进行有效追溯,因此,传统的数据分析手段已不能满足现时段的分析要求,随着大数据理论的不断成熟,大数据技术在税源管理和监控方面的应用及理论研究日常活跃。我国税收信息化起步晚,发展迅速,从最早的CTAIS1.0到CTAIS2.0再到金三核心征管系统,信息化水平越来越高,管理也越来越精细化。研究的重点从税务体制建设到税务信息化建设到税收遵从管理再到税收治理研究,层层递进。特别是在大数据背景及相关行业成功案例下,税收的数据管理、数据挖掘及税收风险管理成为各个学者研究的重点。国外在税收信息化研究方面,普遍重视税收数据的重要性,把税收大数据视为一种重要的资源,通过分析利用推动税收管理优化及提高税收征管效率,随着大数据的深入应用,国外学者开始基于税收大数据,对纳税人行为进行分析,对税收征收与国家各行业的经济关系及制约因素进行研究,最大限度的发挥大数据的应用效果。本专利技术吸收借鉴了国外研究结果,对税收与国民经济行业的经济关系亦进行了相关研究与设计。
技术实现思路
为了解决上述问题,本专利技术提供了一种基于大数据中心的增值税发票应用分析系统,实现对海量的、多种数据来源的增值税发票数据、税收征管数据、其它纳税人相关数据进行分析和比对,从而发现其中潜在的税收问题。一种基于大数据中心的增值税发票应用分析系统,包括:大数据中心和控制中心,所述大数据中心与控制中心连接,用于对税务数据进行采集、分析处理;所述大数据中心基于Hadoop技术搭建,包括Sqoop模块、MapReduce模块、HDFS分布式文件系统、Hive模块、关系数据库、开源数据库及Mahout模块,所述HDFS分布式文件系统连接所述Sqoop模块、MapReduce模块、Hive模块及Mahout模块;所述Sqoop模块基于Sqoop技术从业务系统中采集数据并传输至所述HDFS分布式文件系统;所述MapReduce模块基于MapReduce技术从半结构化的数据文件、日志文件和Excel表格中采集数据并传输至所述分布式文件系统;所述HDFS分布式文件系统将采集到的数据通过所述Hive模块进行ETL过程,并通过所述Hive模块将处理后的结果数据传输至所述控制中心;所述Sqoop模块还用于将处理后的结果数据传输至所述关系数据库,所述关系数据库用于将所述结果数据极性数据展现;所述MapReduce模块还用于将处理后的结果数据传输至所述开源数据库,所述开源数据库基于Hbase进行数据索引;所述Mahout模块用于数据挖掘。进一步地,所述增值税发票应用分析系统还包括数据分析模块,所述数据分析模块与控制中心连接,接收所述控制中心的结果数据;所述数据分析模块包括进项分析、销项分析、发票来源地分析、发票流向地分析、企业流及货物流六个子模块,用于通过对结果数据的挖掘和分析,将发票流、货物流、企业流按照行业和区域进行展示。进一步地,所述增值税发票应用分析系统还包括综合查询模块,所述综合查询模块与所述与控制中心连接,接收所述控制中心的结果数据;所述综合查询模块包括一户式查询、进项发票查询及销项发票查询三个子模块,通过对税务机关、开票日期、发票类别、发票性质、纳税人、发票代码、发票号码、税率、作废标志的设置来实现对发票的精确查找;进一步地,所述增值税发票应用分析系统还包括数据预警模块,所述数据预警模块与所述与控制中心连接,接收所述控制中心的结果数据;所述数据预警模块包括进销项差异监控、自定义疑点监控、农产品收购发票监控、小规模纳税人达标监控、申报表异常监控、纳税人疑点信息监控、红字发票异常监控、作废发票异常监控、金额突增发票监控、销项销货清单监控、进项销货清单监控、减免税异常监控、申报为开票小于0异常监控、普通发票红冲异常监控、专票红字信息单异常监控及开票且有欠税异常监控16个预警子模块和风险对应工作台账,用于对税源进行实时监控、数据系统化分析和风险精准应对。进一步地,所述增值税发票应用分析系统还包括系统管理模块,所述系统管理模块与所述与控制中心连接,接收所述控制中心的结果数据;所述系统管理模块用于对所述增值税发票应用分析系统进行分层级管理。进一步地,所述增值税发票应用分析系统还包括今日看板模块,所述今日看板模块与所述与控制中心连接,接收所述控制中心的结果数据;所述今日看板模块用于对最近一段时间的增值税发票进销项情况进行图表示分析展示。本专利技术的有益效果:本专利技术提供了一种基于大数据中心的增值税发票应用分析系统,能大量高效分析处理税票数据,减少税务人员的工作量,提高工作效率以及质量。通过税务登记信息、进销项发票开具明细、纳税申报信息的加工比对处理,增强后续监管手段,促进发票后续管理精细化。通过疑点纳税人和疑点发票的筛选处理,定期发布疑点信息,提升征管质量,促进税收风险管理常态化。通过经营信息、完税信息、财务报表数据的深度挖掘与清洗转换,理清纳税人经营脉络,揭示区域间、行业间税源发展特点,研判税收经济发展趋势,促进服务经济发展能力专业化,提高经济税收工作的前瞻性和敏感性。附图说明图1为本专利技术实施例提出的一种基于大数据中心的增值税发票应用分析系统的结构示意图。图2为本专利技术实施例的大数据中心的结构示意图。图3为本专利技术实施例的数据分析模块的结构示意图。图4为本专利技术实施例的综合查询模块的结构示意图。图5为本专利技术实施例的数据预警模块的结构示意图。图中:10-增值税发票应用分析系统;110-控制中心;120-大数据中心;121-HDFS分布式文件系统;122-Sqoop模块;123-Ma本文档来自技高网
...

【技术保护点】
1.一种基于大数据中心的增值税发票应用分析系统,其特征在于,包括:大数据中心和控制中心,所述大数据中心与控制中心连接,用于对税务数据进行采集、分析处理;所述大数据中心基于Hadoop技术搭建,包括Sqoop模块、MapReduce模块、HDFS分布式文件系统、Hive模块、关系数据库、开源数据库及Mahout模块,所述HDFS分布式文件系统连接所述Sqoop模块、MapReduce模块、Hive模块及Mahout模块;所述Sqoop模块基于Sqoop技术从业务系统中采集数据并传输至所述HDFS分布式文件系统;所述MapReduce模块基于MapReduce技术从半结构化的数据文件、日志文件和Excel表格中采集数据并传输至所述分布式文件系统;所述HDFS分布式文件系统将采集到的数据通过所述Hive模块进行ETL过程,并通过所述Hive模块将处理后的结果数据传输至所述控制中心;所述Sqoop模块还用于将处理后的结果数据传输至所述关系数据库,所述关系数据库用于将所述结果数据极性数据展现;所述MapReduce模块还用于将处理后的结果数据传输至所述开源数据库,所述开源数据库基于Hbase进行数据索引;所述Mahout模块用于数据挖掘。...

【技术特征摘要】
1.一种基于大数据中心的增值税发票应用分析系统,其特征在于,包括:大数据中心和控制中心,所述大数据中心与控制中心连接,用于对税务数据进行采集、分析处理;所述大数据中心基于Hadoop技术搭建,包括Sqoop模块、MapReduce模块、HDFS分布式文件系统、Hive模块、关系数据库、开源数据库及Mahout模块,所述HDFS分布式文件系统连接所述Sqoop模块、MapReduce模块、Hive模块及Mahout模块;所述Sqoop模块基于Sqoop技术从业务系统中采集数据并传输至所述HDFS分布式文件系统;所述MapReduce模块基于MapReduce技术从半结构化的数据文件、日志文件和Excel表格中采集数据并传输至所述分布式文件系统;所述HDFS分布式文件系统将采集到的数据通过所述Hive模块进行ETL过程,并通过所述Hive模块将处理后的结果数据传输至所述控制中心;所述Sqoop模块还用于将处理后的结果数据传输至所述关系数据库,所述关系数据库用于将所述结果数据极性数据展现;所述MapReduce模块还用于将处理后的结果数据传输至所述开源数据库,所述开源数据库基于Hbase进行数据索引;所述Mahout模块用于数据挖掘。2.如权利要求1所述的基于大数据中心的增值税发票应用分析系统,其特征在于,所述增值税发票应用分析系统还包括数据分析模块,所述数据分析模块与控制中心连接,接收所述控制中心的结果数据;所述数据分析模块包括进项分析、销项分析、发票来源地分析、发票流向地分析、企业流及货物流六个子模块,用于通过对结果数据的挖掘和分析,将发票流、货物流、企业流按照行业和区域进行展示。3.如权利要求1所述的基于大数据中心的增...

【专利技术属性】
技术研发人员:何卫高涛张远舰
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1