【技术实现步骤摘要】
一种非税收缴大数据分析系统
[0001]本专利技术涉及一种非税收缴大数据分析系统,属于非税收缴分析
技术介绍
[0002]非税收缴过程中产生大量的非税数据,非税收缴数据本身能够反应地区和行业的发展状况。申请号为CN201510831784.7的文件公开了一种实现税务舆情分析和全文检索的大数据平台。该申请与现有技术相比,提高了税局应对舆情的监测和应对能力。若能将大数据应用于非税收缴分析,并将分析结果展示给公众和监管人员,有利于公众和监管人员对地区和行业发展的了解与决策。
技术实现思路
[0003]为了克服上述问题,本专利技术提供一种非税收缴大数据分析系统,该系统通过对非税收缴大数据的采集和不同维度的分析,形成丰富的分析结果,并通过应用层进行展示,有利于通过非税收缴大数据对地区和行业的发展进行了解。
[0004]本专利技术的技术方案如下:
[0005]一种非税收缴大数据分析系统,包括非税数据层、非税大数据采集层、非税大数据存储层、非税大数据分析层和非税大数据应用层;
[0006]所述非税数据层包括内部数据源和第三方数据源;所述内部数据源包括基础信息库和非税收缴库,所述第三方数据源包括税务代征收数据、银行端数据、财政征收行政性收费数据和财政征收非税收入退库数据;
[0007]所述非税大数据采集层对所述非税数据层的内部数据源和第三方数据源进行采集,得到内部数据和第三方数据,并将采集到的数据存储至所述非税大数据存储层;
[0008]所述非税大数据分析层对所述非税 ...
【技术保护点】
【技术特征摘要】
1.一种非税收缴大数据分析系统,其特征在于,包括非税数据层、非税大数据采集层、非税大数据存储层、非税大数据分析层和非税大数据应用层;所述非税数据层包括内部数据源和第三方数据源;所述内部数据源包括基础信息库和非税收缴库,所述第三方数据源包括税务代征收数据、银行端数据、财政征收行政性收费数据和财政征收非税收入退库数据;所述非税大数据采集层对所述非税数据层的内部数据源和第三方数据源进行采集,得到内部数据和第三方数据,并将采集到的数据存储至所述非税大数据存储层;所述非税大数据分析层对所述非税大数据存储层中的数据进行预处理和分析,将预处理后的数据和分析结果存储至所述非税大数据存储层中;所述非税大数据应用层读取所述非税大数据存储层中的数据和分析结果,并对外展示。2.根据权利要求1所述非税收缴大数据分析系统,其特征在于,所述非税大数据采集层包括定向自动采集模块、采集规则配置模块、第三方数据导入模块、非税收缴数据同步模块和基础信息数据同步模块;所述定向自动采集模块从所述银行端数据处采集数据,作为第三方数据,所述采集规则配置模块用于设置所述定向自动采集模块的采集频率;所述第三方数据导入模块定期从所述税务代征收数据、财政征收行政性收费数据和财政征收非税收入退库数据处导入数据,作为第三方数据;所述非税收缴数据同步模块用于读取所述非税收缴数据库数据,并同步更新,作为内部数据;所述基础信息数据同步模块用于读取所述基础信息库数据,并同步更新,作为内部数据。3.根据权利要求2所述非税收缴大数据分析系统,其特征在于,所述非税大数据分析层对所述非税大数据存储层中的数据进行预处理,具体包含以下步骤:对非税大数据存储层中的第三方数据进行质量检查,所述质量检查具体为对第三方数据的第一数据要素分别进行规范检查,所述第一数据要素包括执收区划编码、执收单位编码、项目编码、项目开具金额、预算科目编码、执收总金额、资金到账日期和收入类型;当所述第三方数据质量检查不合格时,则不采用该条数据,并将该条数据暂存到异常数据表;对非税大数据存储层中的第三方数据进行整理,所述整理具体为对第三方数据的第二数据要素分别依据编码映射,所述第二数据要素包括执收区划名称、执收单位编码、执收单位名称、项目编码、项目名称、预算科目编码和预算科目名称;当所述第二数据要素中的执收单位编码、项目编码和预算科目编码映射错误时,则不采用该条数据,并将该条数据暂存到异常数据表;将整理后的第三方数据存储至所述非税大数据存储层。4.根据权利要求3所述非税收缴大数据分析系统,其特征在于,所述预处理还包括对非税大数据存储层中的内部数据和整理后的第三方数据进行汇总,所述汇总具体为对所述内部数据和整理后的第三方数据按照区划、单位、科目、项目和到账日期进行多次汇总,并在汇总过程中建立一系列表,并将所述表存储至所述非税大数据存储层。5.根据权利要求4所述非税收缴大数据分析系统,其特征在于,所述汇总过程中存在如下的建表规则:1)汇总后数据量较小的表不进行保存;2)合并数据结构相同的表到同一张表;
3)合并数据结构相同的表时,以数据规模较小的上层表作为下层表的汇总基础。6.根据权利要求3所述非税收缴大数据分析系统,其特征在于,所述非税大数据分析层对所述内部数据和整理后的第三方数据进行分析,包括非税收入主体分析、人才信息主体分析和生态信息主体分析;所述非税大数据应用层根据所述非税大数据分析层的分析,导出非税收入主题报告、人才信息主题报告和生态信息主题报告;所述非税大数据应用层还包括异常...
【专利技术属性】
技术研发人员:陈庸凯,池文倩,黄荣明,
申请(专利权)人:福建博思软件股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。