一种基于数据服务器集群实现数据拆分的方法及系统技术方案

技术编号：14146027 阅读：58 留言：0更新日期：2016-12-11 02:15

本发明专利技术实施例提供一种基于数据服务器集群实现数据拆分的方法及系统，该数据服务器集群中的数据服务器节点呈树状层级分布，所述方法包括：当某层级的某一数据服务器节点出现访问量高于设定的访问量阈值时，于所述数据服务器节点下添加预设取值范围内取值为索引的子数据服务器节点，作为该数据服务器节点的下一层级；将所述数据服务器节点存储的数据拆分到新增加的下一层级的子数据服务器节点中进行存储。上述技术方案具有如下有益效果：通过树的层级扩展能力将单点数据服务器进行进一步的拆分扩展，满足了出现访问量过高的数据服务器的拆分扩展需要，相对于一致性Hash算法实现拆分的数据集群整体来说，无需整体迁移数据。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及互联网
，尤其涉及一种基于数据服务器集群实现数据拆分的方法及系统。
技术介绍
随着业务发展，互联网数据流量会逐年增加。现有技术常通过集群横向扩展来提高后端数据服务的承载能力。常见的前端负载均衡只是简单的“随机”发放。而后端的数据服务器需要进行横向纵向拆分以此缓解单机服务器负载。出于数据一致性的要求对数据服务器集群的数据变更操作是不能“随机”分配，对于数据查找要有一一对应的映射。主要原因是对于更新如果要做到一致性必须保证更新操作是在一个顺序的单线程的情况下进行。只有如此才能保证在：多线程、多进程，多核CPU，多服务、多服务器的环境下更新的数据能够得到正确的结果。所以每条数据在一个集群内只能在一个唯一的线程上做更新操作。数据服务器的操作主要有：增加数据、更新数据、删除数据、查询数据。其中增加、更新、删除都是需要单线程顺序执行的。所以拆分数据服务器的时候是将数据进行加工运算，通过算法计算结果判断当前数据存储在哪个服务器内。理想情况下使用算法可以将数据平均的分配到同组服务器内，如群组内有三台服务器9000条数据，那么每台服务器通过算法会分配每台服务器有3000条数据左右，然而事实上是很多情况下无法保证这个分配是均衡的。很有可能是1000，2000，6000.主要是因为数据参考字段本身就不是均衡导致的。当然数据拆分还有其他方式，比如按日期、按其他维度进行划分，实际规则大同小异，这里将不再叙述。目前业内最常见的数据分配算法是一致性Hash(哈希)算法，他是利用一个有限数值集合。取值范围是0～2的32次方，如果这个集合内有10台服务器，那么就将这个...
一种基于数据服务器集群实现数据拆分的方法及系统

【技术保护点】
一种基于数据服务器集群实现数据拆分的方法，其特征在于，该数据服务器集群中的数据服务器节点呈树状层级分布，所述方法包括：当某层级的某一数据服务器节点出现访问量高于设定的访问量阈值时，于所述数据服务器节点下添加预设取值范围内取值为索引的子数据服务器节点，作为该数据服务器节点的下一层级；将所述数据服务器节点存储的数据拆分到新增加的下一层级的子数据服务器节点中进行存储。

【技术特征摘要】
1.一种基于数据服务器集群实现数据拆分的方法，其特征在于，该数据服务器集群中的数据服务器节点呈树状层级分布，所述方法包括：当某层级的某一数据服务器节点出现访问量高于设定的访问量阈值时，于所述数据服务器节点下添加预设取值范围内取值为索引的子数据服务器节点，作为该数据服务器节点的下一层级；将所述数据服务器节点存储的数据拆分到新增加的下一层级的子数据服务器节点中进行存储。2.如权利要求1所述基于数据服务器集群实现数据拆分的方法，其特征在于，所述数据服务器集群中的数据服务器节点呈基数树Radix结构分布，或呈字典树Trie结构分布。3.如权利要求1所述基于数据服务器集群实现数据拆分的方法，其特征在于，所述预设取值范围为如下之一：0-9，a-z，A-Z，ASCII值范围。4.如权利要求1所述基于数据服务器集群实现数据拆分的方法，其特征在于，所述将所述数据服务器节点存储的数据拆分到新增加的下一层级的子数据服务器节点中进行存储，包括：利用最大匹配算法，将所述数据服务器节点存储的数据拆分到新增加的下一层级的子数据服务器节点中进行存储。5.如权利要求4所述基于数据服务器集群实现数据拆分的方法，其特征在于，所述方法还包括：将数据拆分后的最大匹配路径反馈给用户，以便用户通过所述最大匹配路径找到对应的数据服务器配置，从而利用该数据服务器配置找到对应的数据服务器获取数...

【专利技术属性】
技术研发人员：徐长龙，王崇，任文越，
申请(专利权)人：微梦创科网络科技中国有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人