一种分布式数据处理方法及系统技术方案

技术编号：15189698 阅读：206 留言：0更新日期：2017-04-19 19:36

本发明专利技术公开了一种分布式数据处理方法及系统，包括服务代理单元将请求处理的任务分解成若干个子任务，其中每个子任务只涉及一个维度的计算任务；数据节点在相应的网卡对接收到的子任务进行数据处理。通过本发明专利技术这种将数据节点按照不同的维度进行划分以对不同维度的数据分别进行处理的方式，降低了各数据节点之间的网络IO，提高了跨节点的数据处理的效率，从而避免了短板效应。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及分布式技术，尤指一种分布式数据处理方法及系统。
技术介绍
在分布式数据库系统中，需要将数据打散存放在多个数据节点上，多个数据节点均具备数据计算和加载的能力，通过分布式算法，可以加速特定场景下的数据库查询或计算速度。但是，对于跨节点的数据分析等场景，因为在跨节点的查询或者计算中，必须每一个数据节点的操作都完成，才能合并查询或者计算的结果，这样会降低数据处理的效率，从而形成一定的瓶颈。比如：以查询上海的一个月以内套餐到期的用户为例，由于数据无规则的存放在9个数据节点上，需要先在每个数据节点上查询上海的一个月以内套餐到期的用户，然后再将从9个数据节点上查询出的用户进行合并，才能形成一张上海的一个月以内套餐到期的用户总表。只要存在一个数据节点的结果计算不出来，都无法形成该用户总表。分布式数据库系统大量的网络输入输出(IO)都来自跨节点的数据处理需求，在这种跨节点的数据处理中，任何一个节点的延迟，都会极大降低分布式数据库系统的数据处理效率，从而形成短板效应。
技术实现思路
为了解决上述技术问题，本专利技术提供了一种分布式数据处理方法及系统，能够提高跨节点的数据处理的效率，从而避免短板效应。为了达到本专利技术目的，本专利技术提供了一种分布式数据处理系统，至少包括：包括一个或一个以上应用的应用单元、服务代理单元，以及包括一个或一个以上数据节点的数据节点单元；其中，应用单元，用于发起数据统计、分析、查询或者处理等数据处理请求；服务代理单元，用于接收到数据处理请求，将请求处理的任务分解成若干个子任务，其中每个子任务只涉及一个维度的计算任务，将分解后的子任务输出给...

【技术保护点】
一种分布式数据处理系统，其特征在于，至少包括：包括一个或一个以上应用的应用单元、服务代理单元，以及包括一个或一个以上数据节点的数据节点单元；其中，应用单元，用于发起数据统计、分析、查询或者处理等数据处理请求；服务代理单元，用于接收到数据处理请求，将请求处理的任务分解成若干个子任务，其中每个子任务只涉及一个维度的计算任务，将分解后的子任务输出给指定的数据节点；数据节点，根据不同的维度设置有相应的网卡，根据接收到的计算子任务进行相应数据处理。

【技术特征摘要】
1.一种分布式数据处理系统，其特征在于，至少包括：包括一个或一个以上应用的应用单元、服务代理单元，以及包括一个或一个以上数据节点的数据节点单元；其中，应用单元，用于发起数据统计、分析、查询或者处理等数据处理请求；服务代理单元，用于接收到数据处理请求，将请求处理的任务分解成若干个子任务，其中每个子任务只涉及一个维度的计算任务，将分解后的子任务输出给指定的数据节点；数据节点，根据不同的维度设置有相应的网卡，根据接收到的计算子任务进行相应数据处理。2.根据权利要求1所述的分布式数据处理系统，其特征在于，所述服务代理单元具体用于：对于n个维度M1…Mn，将所述请求处理的任务被分解为各个维度的子任务后，对应至n维的第[F(M1)，...,F(Mi),G(Mi+1),…G(Mn)]的各数据分片上；其中，M(n+1)为新插入的一列的随机数取值，一个9位的随机数；F(Mi)是Mi的表达式，当Mi取特定值时，F(Mi)的值唯一；G(Mj)是Mj的表达式，当Mj属于某个特定区间时，G(Mj)的值唯一；并将分解后的子任务输出给指定的数据节点单元的对应维度的网卡。3.根据将权利要求1所述的分布式数据处理系统，其特征在于，所述服务代理单元具体用于：对于n个维度M1…Mn，将所述请求处理的任务被分解为各个维度的子任务后，对应至(n+1)维的第[F(M1)，...,F(Mi),G(Mi+1),…G(Mn)，H(M(n+1))]的各数据分片上；其中，M(n+1)为新插入的一列的随机数取值，一个9位的随机数；F(Mi)是Mi的表达式，当Mi取特定值时，F(Mi)的值唯一；G(Mj)是Mj的表达式，当Mj属于某个特定区间时，G(Mj)的值唯一；H(M(n+1))是M(n+1)的表达式，H(M(n+1))等于M(n+1)对N取余数；并将分解后的子任务输出给指定的数据节点单元的对应维度的网卡。4.根据权利...

【专利技术属性】
技术研发人员：郭志斌，张云勇，雷磊，陈晓明，
申请(专利权)人：中国联合网络通信集团有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人