一种非税收缴大数据分析系统技术方案

技术编号:30645145 阅读:20 留言:0更新日期:2021-11-04 00:50
本发明专利技术涉及一种非税收缴大数据分析系统,包括非税数据层、非税大数据采集层、非税大数据存储层、非税大数据分析层和非税大数据应用层;非税数据层包括内部数据源和第三方数据源;非税大数据采集层对非税数据层的内部数据源和第三方数据源进行采集,得到内部数据和第三方数据,并将采集到的数据存储至非税大数据存储层;非税大数据分析层对非税大数据存储层中的数据进行预处理和分析,将预处理后的数据和分析结果存储至非税大数据存储层中;非税大数据应用层读取非税大数据存储层中的数据和分析结果,并对外展示。本发明专利技术通过对非税收缴大数据的采集和不同维度的分析,形成丰富的分析结果,并通过应用层进行展示。并通过应用层进行展示。并通过应用层进行展示。

【技术实现步骤摘要】
一种非税收缴大数据分析系统


[0001]本专利技术涉及一种非税收缴大数据分析系统,属于非税收缴分析


技术介绍

[0002]非税收缴过程中产生大量的非税数据,非税收缴数据本身能够反应地区和行业的发展状况。申请号为CN201510831784.7的文件公开了一种实现税务舆情分析和全文检索的大数据平台。该申请与现有技术相比,提高了税局应对舆情的监测和应对能力。若能将大数据应用于非税收缴分析,并将分析结果展示给公众和监管人员,有利于公众和监管人员对地区和行业发展的了解与决策。

技术实现思路

[0003]为了克服上述问题,本专利技术提供一种非税收缴大数据分析系统,该系统通过对非税收缴大数据的采集和不同维度的分析,形成丰富的分析结果,并通过应用层进行展示,有利于通过非税收缴大数据对地区和行业的发展进行了解。
[0004]本专利技术的技术方案如下:
[0005]一种非税收缴大数据分析系统,包括非税数据层、非税大数据采集层、非税大数据存储层、非税大数据分析层和非税大数据应用层;
[0006]所述非税数据层包括内部数据源和第三方数据源;所述内部数据源包括基础信息库和非税收缴库,所述第三方数据源包括税务代征收数据、银行端数据、财政征收行政性收费数据和财政征收非税收入退库数据;
[0007]所述非税大数据采集层对所述非税数据层的内部数据源和第三方数据源进行采集,得到内部数据和第三方数据,并将采集到的数据存储至所述非税大数据存储层;
[0008]所述非税大数据分析层对所述非税大数据存储层中的数据进行预处理和分析,将预处理后的数据和分析结果存储至所述非税大数据存储层中;
[0009]所述非税大数据应用层读取所述非税大数据存储层中的数据和分析结果,并对外展示。
[0010]进一步的,所述非税大数据采集层包括定向自动采集模块、采集规则配置模块、第三方数据导入模块、非税收缴数据同步模块和基础信息数据同步模块;所述定向自动采集模块从所述银行端数据处采集数据,作为第三方数据,所述采集规则配置模块用于设置所述定向自动采集模块的采集频率;所述第三方数据导入模块定期从所述税务代征收数据、财政征收行政性收费数据和财政征收非税收入退库数据处导入数据,作为第三方数据;所述非税收缴数据同步模块用于读取所述非税收缴数据库数据,并同步更新,作为内部数据;所述基础信息数据同步模块用于读取所述基础信息库数据,并同步更新,作为内部数据。
[0011]进一步的,所述非税大数据分析层对所述非税大数据存储层中的数据进行预处理,具体包含以下步骤:
[0012]对非税大数据存储层中的第三方数据进行质量检查,所述质量检查具体为对第三
方数据的第一数据要素分别进行规范检查,所述第一数据要素包括执收区划编码、执收单位编码、项目编码、项目开具金额、预算科目编码、执收总金额、资金到账日期和收入类型;当所述第三方数据质量检查不合格时,则不采用该条数据,并将该条数据暂存到异常数据表;
[0013]对非税大数据存储层中的第三方数据进行整理,所述整理具体为对第三方数据的第二数据要素分别依据编码映射,所述第二数据要素包括执收区划名称、执收单位编码、执收单位名称、项目编码、项目名称、预算科目编码和预算科目名称;当所述第二数据要素中的执收单位编码、项目编码和预算科目编码映射错误时,则不采用该条数据,并将该条数据暂存到异常数据表;
[0014]将整理后的第三方数据存储至所述非税大数据存储层。
[0015]进一步的,所述预处理还包括对非税大数据存储层中的内部数据和整理后的第三方数据进行汇总,所述汇总具体为对所述内部数据和整理后的第三方数据按照区划、单位、科目、项目和到账日期进行多次汇总,并在汇总过程中建立一系列表,并将所述表存储至所述非税大数据存储层。
[0016]进一步的,所述汇总过程中存在如下的建表规则:
[0017]汇总后数据量较小的表不进行保存;
[0018]合并数据结构相同的表到同一张表;
[0019]合并数据结构相同的表时,以数据规模较小的上层表作为下层表的汇总基础;
[0020]进一步的,所述非税大数据分析层对所述非税大数据存储层中的数据进行分析,包括非税收入主体分析、人才信息主体分析和生态信息主体分析;所述非税大数据应用层根据所述非税大数据分析层的分析,导出非税收入主题报告、人才信息主题报告和生态信息主题报告;所述非税大数据应用层还包括异常数据预警模块,所述异常数据预警模块对各项目开具票据信息进行监控并标注可疑票据。
[0021]进一步的,所述非税收入主体分析包括非税收入总体情况分析、一般公共预算收入情况分析、一般公共预算项目收入情况分析、科目或项目非税收入情况分析、非税收入进度监控分析和成本构成分析;
[0022]所述非税收入总体情况分析具体为按照区划和年度统计非税总收入;
[0023]所述一般公共预算收入情况分析具体为按照区划和年度统计一般公共预算收入和一般公共预算非税收入;
[0024]所述一般公共预算项目收入情况分析具体为按照区划和年度统计一般公共预算收入中排名靠前的项目;
[0025]所述科目或项目非税收入情况分析具体为按照年度统计各科目或项目的非税收入,并计算各科目或项目本年度与上一年度的非税收入比值;
[0026]所述非税收入进度监控分析具体为按照年度统计各项目的非税收入与计划收入的差额及比值;
[0027]所述成本构成分析具体为按照年度统计各项目的成本性支出占非税收入的比重;
[0028]所述异常数据预警模块对所述科目或项目非税收入情况分析和所述成本构成分析进行监控和预警。
[0029]进一步的,所述人才信息主题分析包括人才培养收费总体情况分析、人才行业分
布及增长情况分析和各行业缴款书换开票据开具情况分析;
[0030]所述人才收费培养总体情况分析包括:
[0031]统计区划内受教育人数及其月度环比;
[0032]统计考务考试费项目的票据开具的份数、金额及份数、金额各自的月度环比;
[0033]统计培训费项目的票据开具的份数、金额及份数、金额各自的月度环比;
[0034]所述人才行业分布及增长情况分析具体为统计各行业考试考务费与培训费项目的票据开具份数及其年度增长率;
[0035]所述各行业缴款书换开票据开具情况分析具体为统计各行业考试考务费与培训费项目的票据开具份数及各行业份数的占比。
[0036]进一步的,所述生态信息主体分析包括生态资源征收总体情况分析、年度生态资源收费增长情况分析、近两年生态资源征收情况按区划分析和近两年生态资源征收情况按收费类型分析;
[0037]所述生态资源征收总体情况分析具体为按照年度统计生态项目票据的开具份数及金额;所述生态项目包括排污费、森林植被恢复费、水土保持补偿费、土地复垦费项目;
[0038]所述年度生态资源收费增长情况分析具体为按照年度统计各区划的生态资源收费增长率本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种非税收缴大数据分析系统,其特征在于,包括非税数据层、非税大数据采集层、非税大数据存储层、非税大数据分析层和非税大数据应用层;所述非税数据层包括内部数据源和第三方数据源;所述内部数据源包括基础信息库和非税收缴库,所述第三方数据源包括税务代征收数据、银行端数据、财政征收行政性收费数据和财政征收非税收入退库数据;所述非税大数据采集层对所述非税数据层的内部数据源和第三方数据源进行采集,得到内部数据和第三方数据,并将采集到的数据存储至所述非税大数据存储层;所述非税大数据分析层对所述非税大数据存储层中的数据进行预处理和分析,将预处理后的数据和分析结果存储至所述非税大数据存储层中;所述非税大数据应用层读取所述非税大数据存储层中的数据和分析结果,并对外展示。2.根据权利要求1所述非税收缴大数据分析系统,其特征在于,所述非税大数据采集层包括定向自动采集模块、采集规则配置模块、第三方数据导入模块、非税收缴数据同步模块和基础信息数据同步模块;所述定向自动采集模块从所述银行端数据处采集数据,作为第三方数据,所述采集规则配置模块用于设置所述定向自动采集模块的采集频率;所述第三方数据导入模块定期从所述税务代征收数据、财政征收行政性收费数据和财政征收非税收入退库数据处导入数据,作为第三方数据;所述非税收缴数据同步模块用于读取所述非税收缴数据库数据,并同步更新,作为内部数据;所述基础信息数据同步模块用于读取所述基础信息库数据,并同步更新,作为内部数据。3.根据权利要求2所述非税收缴大数据分析系统,其特征在于,所述非税大数据分析层对所述非税大数据存储层中的数据进行预处理,具体包含以下步骤:对非税大数据存储层中的第三方数据进行质量检查,所述质量检查具体为对第三方数据的第一数据要素分别进行规范检查,所述第一数据要素包括执收区划编码、执收单位编码、项目编码、项目开具金额、预算科目编码、执收总金额、资金到账日期和收入类型;当所述第三方数据质量检查不合格时,则不采用该条数据,并将该条数据暂存到异常数据表;对非税大数据存储层中的第三方数据进行整理,所述整理具体为对第三方数据的第二数据要素分别依据编码映射,所述第二数据要素包括执收区划名称、执收单位编码、执收单位名称、项目编码、项目名称、预算科目编码和预算科目名称;当所述第二数据要素中的执收单位编码、项目编码和预算科目编码映射错误时,则不采用该条数据,并将该条数据暂存到异常数据表;将整理后的第三方数据存储至所述非税大数据存储层。4.根据权利要求3所述非税收缴大数据分析系统,其特征在于,所述预处理还包括对非税大数据存储层中的内部数据和整理后的第三方数据进行汇总,所述汇总具体为对所述内部数据和整理后的第三方数据按照区划、单位、科目、项目和到账日期进行多次汇总,并在汇总过程中建立一系列表,并将所述表存储至所述非税大数据存储层。5.根据权利要求4所述非税收缴大数据分析系统,其特征在于,所述汇总过程中存在如下的建表规则:1)汇总后数据量较小的表不进行保存;2)合并数据结构相同的表到同一张表;
3)合并数据结构相同的表时,以数据规模较小的上层表作为下层表的汇总基础。6.根据权利要求3所述非税收缴大数据分析系统,其特征在于,所述非税大数据分析层对所述内部数据和整理后的第三方数据进行分析,包括非税收入主体分析、人才信息主体分析和生态信息主体分析;所述非税大数据应用层根据所述非税大数据分析层的分析,导出非税收入主题报告、人才信息主题报告和生态信息主题报告;所述非税大数据应用层还包括异常...

【专利技术属性】
技术研发人员:陈庸凯池文倩黄荣明
申请(专利权)人:福建博思软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1