一种海量网络发票明细数据分布式分析方法技术

技术编号:9462956 阅读:137 留言:0更新日期:2013-12-19 00:27
本发明专利技术提供一种海量网络发票明细数据分布式分析方法,其具体分析过程为:构建网络发票明细数据计算工作集群,客户机服务节点:用于接收来自客户的计算指令;任务调度服务节点:用于进行节点管理和任务追踪;数据仓库节点:存储需要参与分析计算得的原始网络发票明细数据;分布式计算节点:用于进行原始数据处理和生成目标键值对;汇聚计算节点:根据计算指令对数据预处理结果进行汇聚计算,并返还计算结果和注销调度任务。该一种海量网络发票明细数据分布式分析方法和现有技术相比,解决原系统中的性能瓶颈,从而实现提高海量网络发票明细数据的分析计算效率,实用性强,易于推广。?

【技术实现步骤摘要】
【专利摘要】本专利技术提供,其具体分析过程为:构建网络发票明细数据计算工作集群,客户机服务节点:用于接收来自客户的计算指令;任务调度服务节点:用于进行节点管理和任务追踪;数据仓库节点:存储需要参与分析计算得的原始网络发票明细数据;分布式计算节点:用于进行原始数据处理和生成目标键值对;汇聚计算节点:根据计算指令对数据预处理结果进行汇聚计算,并返还计算结果和注销调度任务。该和现有技术相比,解决原系统中的性能瓶颈,从而实现提高海量网络发票明细数据的分析计算效率,实用性强,易于推广。【专利说明】
本专利技术涉及税务行业的数据分析和数据处理技术,具体的说是。
技术介绍
随着国家金税三期网络发票项目的推广,全国纳税人每年可产生以TB为单位的海量网络发票明细数据,这些数据如何能够被更高效的分析利用,从而作为管理机构的决策依据,已经成为各级管理部门日益突出的需求。在现有的网络发票明细数据计算体系中,影响性能的主要有两大方面的原因: 一是现有的计算机组成体系和计算模式。二是现有的网络发票明细数据在关系型数据库中的半结构化存储模式。综合分析以上两大原因,在进行海量网络发票明细数据分析计算时,其本文档来自技高网...

【技术保护点】
一种海量网络发票明细数据分布式分析方法,其特征在于,其具体分析过程为:1)首先构建网络发票明细数据计算工作集群,该工作集群包含以下节点:客户机服务节点、与客户机服务节点通信连接的任务调度服务节点、与任务调度服务节点通信连接的数据仓库节点、与数据仓库节点通信连接的分布式计算节点、与任务调度服务节点及分布式计算节点均通信连接的汇聚计算节点;2)由客户机服务节点接收来自客户的计算指令;3)根据计算指令,任务调度服务节点进行节点管理和任务追踪;4)数据仓库节点存储需要参与分析计算得的原始网络发票明细数据;5)分布式计算节点进行原始数据处理和生成目标键值对;6)根据计算指令由汇聚计算节点对数据预处理结果...

【技术特征摘要】

【专利技术属性】
技术研发人员:徐兵兵于治楼王永军
申请(专利权)人:浪潮齐鲁软件产业有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1