数据重分布方式的确定方法、装置、服务器及存储介质制造方法及图纸

技术编号：21952355 阅读：28 留言：0更新日期：2019-08-24 17:41

本发明专利技术实施例公开了一种数据重分布方式的确定方法、装置、服务器及存储介质。该方法包括：遍历执行二叉树，按照由上至下的顺序，依次确定所述执行二叉树上非叶节点的期望重分布项，所述执行二叉树通过对用户所输入结构化查询语句的解析生成，按照由下至上的顺序，针对每一个非叶节点，确定所述非叶节点的可选重分布项，根据所述期望重分布项确定所述可选重分布项的优先级，根据所述可选重分布项的优先级确定所述非叶节点所包含子节点的数据重分布方式。与现有技术相比，本发明专利技术实施例为非叶节点的可选重分布项设置了优先级，同时考虑了上层节点和下层节点对当前非叶节点的可选重分布项的影响，提高了系统执行效率。

Method, Device, Server and Storage Medium for Determining Data Redistribution Mode

全部详细技术资料下载

【技术实现步骤摘要】
数据重分布方式的确定方法、装置、服务器及存储介质
本专利技术实施例涉及数据库
，尤其涉及一种数据重分布方式的确定方法、装置、服务器及存储介质。
技术介绍
MPP(MassivelyParallelProcessing)即大规模并行处理，在非共享数据库集群中，每个节点都有独立磁盘存储系统和内存系统，节点间数据通过网络相互连接，彼此协调计算。简单来说，MPP是将任务并行的分散到多个服务器和节点上，在每个节点上计算完成后，将各自部分的结果汇总在一起得到最终的执行结果。在MPP环境下，数据库表以合适的分布列进行数据分布，存储在各节点上。常见的分布方式有哈希分布(HASH)、随机分布(RAND)和复制分布(FULL)等。在进行多表连接操作时，总是两两连接的，即两表进行连接的结果再与另一表或另一两表连接结果进行连接，类似于树状层次分布。当连接操作涉及非分布列时，需要对数据进行重分布。传统方式在对某节点的数据进行重分布时，虽然考虑了下层节点数据分布的影响，但系统执行效率仍然较低。
技术实现思路
本专利技术实施例提供一种数据重分布方式的确定方法、装置、服务器及存储介质，以提高系统的执行效率。第一方面，本专利技术实施例提供一种数据重分布方式的确定方法，包括：遍历执行二叉树，按照由上至下的顺序，依次确定所述执行二叉树上非叶节点的期望重分布项，所述执行二叉树通过对用户所输入结构化查询语句的解析生成；按照由下至上的顺序，针对每一个非叶节点，确定所述非叶节点的可选重分布项；根据所述期望重分布项确定所述可选重分布项的优先级；根据所述可选重分布项的优先级确定所述非叶节点所包含子节点的...

【技术保护点】
1.一种数据重分布方式的确定方法，其特征在于，包括：遍历执行二叉树，按照由上至下的顺序，依次确定所述执行二叉树上非叶节点的期望重分布项，所述执行二叉树通过对用户所输入结构化查询语句的解析生成；按照由下至上的顺序，针对每一个非叶节点，确定所述非叶节点的可选重分布项；根据所述期望重分布项确定所述可选重分布项的优先级；根据所述可选重分布项的优先级确定所述非叶节点所包含子节点的数据重分布方式。

【技术特征摘要】
1.一种数据重分布方式的确定方法，其特征在于，包括：遍历执行二叉树，按照由上至下的顺序，依次确定所述执行二叉树上非叶节点的期望重分布项，所述执行二叉树通过对用户所输入结构化查询语句的解析生成；按照由下至上的顺序，针对每一个非叶节点，确定所述非叶节点的可选重分布项；根据所述期望重分布项确定所述可选重分布项的优先级；根据所述可选重分布项的优先级确定所述非叶节点所包含子节点的数据重分布方式。2.根据权利要求1所述的方法，其特征在于，所述确定所述执行二叉树上非叶节点的期望重分布项，包括：解析所述结构化查询语句，确定所述非叶节点对应的特征项；根据所述特征项确定所述非叶节点的初始期望重分布项；遍历过程中，若当前节点为过滤节点，且所述过滤节点对应的过滤条件满足设定形式，则将所述过滤条件中的表达式从所述过滤节点的祖先节点的初始期望重分布项中移除，获得期望重分布项；否则，将所述初始期望重分布项作为期望重分布项。3.根据权利要求1所述的方法，其特征在于，所述确定所述非叶节点的可选重分布项，包括：解析所述结构化查询语句，确定所述非叶节点对应的特征项；根据所述特征项确定所述非叶节点的可选重分布项。4.根据权利要求1所述的方法，其特征在于，所述根据所述期望重分布项确定所述可选重分布项的优先级，包括：按照由下至上的顺序，针对每一个非叶节点，获取所述非叶节点的至少一个可选重分布项；将各所述可选重分布项分别与所述非叶节点的期望重分布项以及所述非叶节点的祖先节点的期望重分布项匹配；根据匹配结果确定各所述可选重分布项的优先级。5.根据权利要求1所述的方法，其特征在于，所述根据所述可选重分布项的优先级确定所述非叶节点所包含子节点的数据重分布方式，包括：根据所述可选重分布项的优先级确定对应所述可选重分布项的权重；根据所述权重确定所述非叶节点在所述权重对应的可选重分布项下的代价值；根据所述...

【专利技术属性】
技术研发人员：张钦，
申请(专利权)人：上海达梦数据库有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人