一种分布式数据库自适应副本选择方法及装置制造方法及图纸

技术编号：38573598 阅读：12 留言：0更新日期：2023-08-22 21:07

本发明专利技术公开了一种分布式数据库自适应副本选择方法及装置，属于分布式数据库领域，本发明专利技术要解决的技术问题为如何快速选取副本用来提高效率，技术方案为：S101、网关节点解析SQL语句，获取该语句中要读取的数据范围；S102、从副本缓存信息中过滤掉旧版本的副本，并获取拥有最新版本的Range大小；S103、将步骤S102中得到的副本信息参数传递到遗传进化算法中，随即生成关于可选择的副本分布信息的种群开始迭代；S104、设置截断机制；S105、由网关节点发送到对应的节点进行读取；S106、将各个节点的结果汇集到网关节点并返回给客户端。与现有技术相比，本发明专利技术遗传进化在很短的时间内可以得到良好的优化结果。可以得到良好的优化结果。可以得到良好的优化结果。

全部详细技术资料下载

【技术实现步骤摘要】
一种分布式数据库自适应副本选择方法及装置

[0001]本专利技术涉及分布式数据库领域，具体提供一种分布式数据库自适应副本选择方法及装置。

技术介绍

[0002]读取数据，是一种数据库中常见的操作，常用于SQL语句执行计划中的第一个算子；无论在各种交易模型的 OLTP 场景下，还是计算分析模型的 OLAP 场景下，都是基础操作，读取数据算子也都是基础算子。
[0003]分布式数据库的性能主要体现在集群中的无共享节点存储了部分数据并且能够独立做并行计算，当其中某个节点的任务完成等待其他节点时，出现负载不平衡的现象造成资源闲置。
[0004]分布式数据库在存储上采用多副本策略，即将数据表分区后每份数据同时存在多个节点中，读取任务分配就是对这多个节点进行选择。每份数据的数据量不同，节点与网关节点的延迟也不同。将读取任务分配到节点上并保证节点上读取任务量均衡就成为了一种以组合优化问题为基础以实现负载均衡为目的的主要技术实现方案。
[0005]副本选择策略的相关技术在分布式数据库中通常采用就近原则，选择距离网关节点延迟最短的节点。即网关节点已知要读取的数据的范围，该范围涉及到的每份数据都有三个副本即三个节点进行选择，选择距离网关节点延迟最短的节点，减少请求发送和返回的时间延迟。对于强一致性读取即获取最新版本数据保证数据最新，则要考虑共识算法，该类型读取由于要保证数据版本最新默认会选择共识算法中的领导者节点来保证强一致性读取。
[0006]分布式数据库的性能主要体现在多个节点可以并行工作提升单机模式...

【技术保护点】

【技术特征摘要】
1.一种分布式数据库自适应副本选择方法，其特征在于，所述分布式数据库分为强一致性读取和延迟读取两种；所述强一致性读取自适应混合副本选择方法步骤如下：S101、网关节点解析SQL语句，获取该语句中要读取的数据范围；S102、从副本缓存信息中过滤掉旧版本的副本，并获取拥有最新版本的Range大小；S103、将步骤S102中得到的副本信息参数传递到遗传进化算法中，随即生成关于可选择的副本分布信息的种群开始迭代；S104、设置截断机制；S105、由网关节点发送到对应的节点进行读取；S106、将各个节点的结果汇集到网关节点并返回给客户端；所述延迟读取自适应混合副本选择方法步骤如下：S201、网关节点解析SQL语句，获取所述SQL语句中要读取的数据范围；S202、将步骤S201获取到的分布信息作为参数传入到遗传进化算法进行迭代；S203、将遗传进化算法与截断机制进行判断相结合；S204、由网关节点发送到对应的节点进行读取；S205、将各个节点的结果汇集到网关节点并返回给客户端。2.根据权利要求1所述的一种分布式数据库自适应副本选择方法，其特征在于，在步骤S101中，网关节点解析SQL语句，获取所述SQL语句中要读取的数据范围，根据分布层中索引的树形结构获取到数据范围中每个Range的分布信息。3.根据权利要求2所述的一种分布式数据库自适应副本选择方法，其特征在于，在步骤S102中，从副本缓存信息中过滤掉旧版本的副本，并获取拥有最新版本的Range大小，同时并行运行系统默认的副本选择策略获取到所有节点中读取最大任务量与读取最小任务量的差值；默认副本选择策略实现单一简单可以先行获取。4.根据权利要求3所述的一种分布式数据库自适应副本选择方法，其特征在于，在步骤S103中，将步骤S102中得到的副本信息参数传递到遗传进化算法中，随即生成关于可选择的副本分布信息的种群开始迭代，迭代过程由交叉变异构成，每轮迭代都会选出最好的基因获得当前读取...

【专利技术属性】
技术研发人员：赵衎衎，冷友方，魏可伟，陈磊，
申请(专利权)人：山东浪潮数据库技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人