The present invention provides a system and method for distributed analysis of invoice data, the system includes: a client, for receiving instructions from the customer analysis; distributed resource management unit, which is used for data processing according to the invoice request for resource coordination; distributed computing unit, which is used for pretreatment of all invoice data according to the multiple dimensions and related invoice data, invoice data results in the formation of various dimensions; data storage unit for storing distributed invoice data generated in each dimension calculation unit; distributed batch processing unit, which is used to generate the calculation calculation order set; distributed cooperative unit, which is used for distributed calculation according to the number of the processing unit generates a set of commands to calculate, and return the results; distributed file storage Unit, which is used to temporarily store the results of the distributed collaboration unit.
【技术实现步骤摘要】
一种用于对发票数据进行分布式分析的系统和方法
本专利技术涉及数据分析领域,并且更具体地,涉及一种用于对发票数据进行分布式分析的系统和方法。
技术介绍
现有的发票数据分析方法主要是从硬件配置合理化方面出发,着重描述如何提高发票明细数据的分析计算效率,但对于如何根据发票数据涉及的不同关系人的需求出发,构建发票数据的维度,通过为原始发票数据进行分类,从而提高发票数据分析的效率却没有研究。
技术实现思路
为了解决
技术介绍
存在的如何从发票数据涉及的不同关系人的需求出发构建发票数据维度来进行发票数据的分布式分析的技术问题,本专利技术提供一种用于对发票数据进行分布式分析的系统,所述系统包括:客户机,其用于接收来自客户的分析指令,对分析指令进行预处理,将数据分为数据范围指令和数据处理指令,并向分布式资源管理单元提交发票数据处理请求;分布式资源管理单元,其用于根据所述发票数据处理请求进行资源协调,生成任务调试清单,将数据范围命令发送至数据存储单元,将数据处理命令发送至分布式批处理单元;分布式计算单元,其用于根据与发票数据相关的多个维度进行所有发票数据的预处理,形成各个维度的发票数据结果 ...
【技术保护点】
一种用于对发票数据进行分布式分析的系统,其特征在于,所述系统包括:客户机,其用于接收来自客户的分析指令,对分析指令进行预处理,将数据分为数据范围指令和数据处理指令,并向分布式资源管理单元提交发票数据处理请求;分布式资源管理单元,其用于根据所述发票数据处理请求进行资源协调,生成任务调试清单,将数据范围命令发送至数据存储单元,将数据处理命令发送至分布式批处理单元;分布式计算单元,其用于根据与发票数据相关的多个维度进行所有发票数据的预处理,形成各个维度的发票数据结果;数据存储单元,其用于存储分布式计算单元所生成的各个维度的发票数据;分布式批处理单元,其用于根据客户的数据处理请求生 ...
【技术特征摘要】
1.一种用于对发票数据进行分布式分析的系统,其特征在于,所述系统包括:客户机,其用于接收来自客户的分析指令,对分析指令进行预处理,将数据分为数据范围指令和数据处理指令,并向分布式资源管理单元提交发票数据处理请求;分布式资源管理单元,其用于根据所述发票数据处理请求进行资源协调,生成任务调试清单,将数据范围命令发送至数据存储单元,将数据处理命令发送至分布式批处理单元;分布式计算单元,其用于根据与发票数据相关的多个维度进行所有发票数据的预处理,形成各个维度的发票数据结果;数据存储单元,其用于存储分布式计算单元所生成的各个维度的发票数据;分布式批处理单元,其用于根据客户的数据处理请求生成数据存储单元对应维度的发票数据进行分析计算的计算命令集合;分布式协作单元,其用于根据分布式批处理单元生成的计算命令集合,调用数据存储单元对应维度的发票数据进行计算,并返还计算结果至分布式文件存储单元和分布式资源管理单元,以及请求分布式资源管理单元注销任务,其中,所述计算结果是根据客户输入的分析指令而生成的发票数据分析结果;分布式文件存储单元,其用于临时存储分布式协作单元的计算结果。2.根据权利要求1所述的系统,其特征在于,分布式计算单元形成的各个维度的发票数据结果从纳税人、税务机关和商品三个方面构建,其中:从纳税人角度,所述维度包括:纳税人差异维度:纳税人地域、行业、天气、进项商品、销项商品;纳税人维度:购方、销方、交易商品、交易时间、销售的渠道;纳税人税率维度:销方纳税人、销方税务机关、发票类别、税率、金额、税额、发票份数;从商品角度,所述维度包括:商品维度:交易商品、商品分类、交易单位、数量、交易时间、商品价格、交易金额、交易地点、行业;来源地户数维度:省内市外金额、省内市外税额、购方税务机关、发票类别、行业代码、省内金额、省内税额、省外金额、省外税额、发票份数、销方户数、购方户数;流向地行业维度:流向地发生的金额、税额、购方数量、销方数量、行业;来源地行业维度:来源地发生的金额、税额、购方数量、销方数量、行业;从税务机关角度,所述维度:税务机关行业维度:各级别的税务机关涉及的行业;税务局维度:统计购方纳税人、购方税务机关、销方税务机关、发票类别、销方户数、金额、税额、发票份数、销方纳税人名称;税务机关户数维度:税务机关、金额、税额、发票份数、发票类别、购方户数、门类代码、纳税人资格代码。3.根据权利要求2所述的系统,其特征在于,分布式协作单元根据分布式批处理单元生成的计算命令集合,调用数据存储单元对应维度的发票数据进行计算而生成的计算结果包括:从发票数据中的购方角度,所述计算结果包括:从商...
【专利技术属性】
技术研发人员:朱延超,范立波,张北南,张健,李蓓,陈懿,王彤,
申请(专利权)人:大象慧云信息技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。