一种分布式数据库查询优化方法技术

技术编号:37051921 阅读:19 留言:0更新日期:2023-03-29 19:29
本发明专利技术公开了一种分布式数据库查询优化方法,包括:建立分布式数据库构架,构建染色体种群;构建用于评价染色体适应度值的适应度函数,根据适应度函数计算每条染色体的适应度值;根据轮盘赌比例选择方法和各个染色体的适应度值进行选择操作,产生选择后的染色体;对选择后的染色体进行交叉操作,得到交叉后的染色体;对交叉后的染色体进行变异操作,得到变异后的染色体;将变异后的染色体转换成查询路径,根据查询路径判断是否满足结束条件;若是,则输出查询路径。本发明专利技术通过设置结束条件、选择操作、交叉操作和变异操作,可得到近似最优的查询方案,提高了查询效率和查询性能。提高了查询效率和查询性能。提高了查询效率和查询性能。

【技术实现步骤摘要】
一种分布式数据库查询优化方法


[0001]本专利技术涉及分布式数据库
,尤其是一种分布式数据库查询优化方法。

技术介绍

[0002]分布式数据库的一个重要特点是其所处理的内容大多都不是来自一个地方的,而它的查询操作又有以下特点:数据在网络间传递,传递完成之后在局部进行处理。但当一个查询关系随着连接的关系数的增加,执行该查询操作的代价就会呈现指数级的增加,这就造成了分布式数据库查询技术的复杂性。
[0003]查询的响应速度直接影响着用户的查询体验,查询策略的优劣程度严重影响着数据查询响应时间和数据查询执行代价。分布式数据库往往具有分布性,其逻辑站点上的数据又往往具有冗余性,现有的分布式数据库的查询技术中,查询效率较低。因此,如何提高分布式数据库的查询效率即查询优化成为亟需解决的问题。

技术实现思路

[0004]针对现有技术中的缺陷,本专利技术提供了一种分布式数据库查询优化方法,可提高查询效率。
[0005]本专利技术提供了一种分布式数据库查询优化方法,包括步骤:
[0006]S1,建立分布式数据库构架,设定在分布式数据库构架中的每一个数据库均为一个点,发起数据查询的点为初始点;
[0007]S2,从初始点开始,随机向任意一个点A发起查询,点A向另外一个任意点B发起查询;
[0008]S3,重复执行步骤S2,最终产生染色体种群;
[0009]S4,构建用于评价染色体适应度值的适应度函数,根据所述适应度函数计算每条染色体的适应度值;
[0010]S5,根据轮盘赌比例选择方法和各个染色体的适应度值进行选择操作,产生选择后的染色体;
[0011]S6,对选择后的染色体进行交叉操作,得到交叉后的染色体;
[0012]S7,对交叉后的染色体进行变异操作,得到变异后的染色体;
[0013]S8,将变异后的染色体转换成查询路径,根据查询路径判断是否满足结束条件;若是,则输出所述查询路径;若否,将所有变异后的染色体作为新的染色体种群返回步骤S4。
[0014]优选地,所述步骤S5具体包括:
[0015]S51,将所述染色体种群中所有的染色体按照适应度值进行排序,将适应度值最小的第一预设数量的染色体直接淘汰;
[0016]S52,使用最优保留策略,将适应度值最大的第二预设数量的染色体进行保留;
[0017]S53,使用轮盘赌比例选择方法选出第三预设数量的染色体;
[0018]S54,将所述第二预设数量的染色体和所述第三预设数量的染色体作为选择后的
染色体。
[0019]优选地,所述染色体为二维染色体;
[0020]所述步骤S6具体包括:
[0021]S61,将所有选择后的染色体划分为N个相同大小的块M;
[0022]S62,随机在二维染色体中设置一个块状M
i,j
,其中0<i≤N,0<j≤N;
[0023]S63,随机交换两个二维染色体被设定的M
i
±
1,j
±1交叉块状的部分,得到交叉后的染色体。
[0024]优选地,所述步骤S7具体包括:
[0025]S71,将所述交叉后的染色体中适应度值最小的第四预设数量的染色体进行强制变异;
[0026]S72,将所述交叉后的染色体中剩余的染色体进行标准变异操作;
[0027]S73,将强制变异后的第四预设数量的染色体与进行标准变异操作后的染色体作为变异后的染色体。
[0028]优选地,所述适应度值为通信代价。
[0029]优选地,所述通信代价包括网络传输代价。
[0030]优选地,所述通信代价包括查询代价。
[0031]优选地,所述结束条件根据最大迭代次数和种群收敛程度进行设置。
[0032]本专利技术的有益效果为:
[0033]采用基于遗传算法的查询优化算法,通过设置结束条件、选择操作、交叉操作和变异操作,可得到近似最优的查询方案,提高了查询效率和查询性能。本专利技术通过直接淘汰法和最优保留策略,提升了种群多样性的同时又具有较好的针对性;通过基于块的交叉操作方法,操作简单,缩小了交叉的范围、保持了新个体与原来的差异性,同时提高了运算速度,有利于实现遗传算法的全局搜索;通过变异操作方法同时兼顾了个体的适应度值与单独基因的影响,而且不影响算子的基本运算,可以达到较好的计算效果;结束条件采用最大迭代次数和种群收敛程度相结合的方式,能够更准确地给出种群最优解。
附图说明
[0034]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
[0035]图1为本专利技术实施例提供的一种分布式数据库查询优化方法的流程示意图。
具体实施方式
[0036]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0037]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整
体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0038]还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0039]还应当进一步理解,本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0040]需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本专利技术所属领域技术人员所理解的通常意义。
[0041]如图1所示,本专利技术实施例提供了一种分布式数据库查询优化方法,包括步骤:
[0042]S1,建立分布式数据库构架,设定在分布式数据库构架中的每一个数据库均为一个点,发起数据查询的点为初始点;分布式数据库是分散的,不同的计算机网络节点可以在不同的地方和不同的站点,在分散的表相里内部却有着严格的统一。例如一个大公司在全世界有很多个分公司,每个分公司都存有一定的数据,各个公司通过网络连接起来,这样每个分公司都有自己运营所需的数据,它们在理论上有着相同的数据系统,可以用自己的数据系统对公司进行管理操作,当然也可以通过总公司的大型数据管理中心对这些小公司进行监控和管理指导等一系列操作。这样,各个分公司之间的信息既能灵活交流和分享,又能进行统一管理本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分布式数据库查询优化方法,其特征在于,包括步骤:S1,建立分布式数据库构架,设定在分布式数据库构架中的每一个数据库均为一个点,发起数据查询的点为初始点;S2,从初始点开始,随机向任意一个点A发起查询,点A向另外一个任意点B发起查询;S3,重复执行步骤S2,最终产生染色体种群;S4,构建用于评价染色体适应度值的适应度函数,根据所述适应度函数计算每条染色体的适应度值;S5,根据轮盘赌比例选择方法和各个染色体的适应度值进行选择操作,产生选择后的染色体;S6,对选择后的染色体进行交叉操作,得到交叉后的染色体;S7,对交叉后的染色体进行变异操作,得到变异后的染色体;S8,将变异后的染色体转换成查询路径,根据查询路径判断是否满足结束条件;若是,则输出所述查询路径;若否,将所有变异后的染色体作为新的染色体种群返回步骤S4。2.根据权利要求1所述的一种分布式数据库查询优化方法,其特征在于,所述步骤S5具体包括:S51,将所述染色体种群中所有的染色体按照适应度值进行排序,将适应度值最小的第一预设数量的染色体直接淘汰;S52,使用最优保留策略,将适应度值最大的第二预设数量的染色体进行保留;S53,使用轮盘赌比例选择方法选出第三预设数量的染色体;S54,将所述第二预设数量的染色体和所述第三预设数量的染色体作为选择后的染色体。3.根据权利要...

【专利技术属性】
技术研发人员:陈培镇杨博文
申请(专利权)人:北京自然常数计算机系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1