【技术实现步骤摘要】
【国外来华专利技术】数据分布的方法、装置及系统
本专利技术涉及信息
,尤其涉及一种数据分布的方法、装置及系统。
技术介绍
并行数据库系统是一种将数据内容分布存储在多个数据节点上的数据存储技术,可以根据哈希(Hash)、范围(Range)、轮转(Round-bin)等算法,将一个逻辑数据表分布在各个数据节点上。并行数据库系统在各个数据节点上并行查询用户需要的数据内容,相对非并行数据库系统而言查询速度快,并且易于管理数据内容。通常,逻辑数据表中会包含多个字段,并行数据库系统以其中的一个(或多个)字段内容作为上述算法的自变量对该逻辑数据表在数据节点上进行分布存储,作为自变量的字段称为该逻辑数据表的分布列。现有技术中,并行数据库系统对多个逻辑数据表的分布表进行分布列联合(Join)查询时,如果具有查询关系的多个分布表的分布列不相同,则需要根据多个分布表共有的分布列对多个逻辑数据表重新进行分布,从而影响查询效率。
技术实现思路
本专利技术的实施例提供一种数据分布的方法、装置及系统,能够节省查询时间,提高查询效率。一方面,本专利技术实施例提供了一种数据分布的方法,包括:在数据查询前,控制节点根据创建规则设置分布表创建指示,所述分布表创建指示中携带逻辑数据表的标识ID以及选定分布列的分布列标识,其中所述选定分布列为所述逻辑数据表中的分布列,所述逻辑数据表为所述控制节点中已创建的逻辑数据表;所述控制节点向数据节点发送所述分布表创建指示,以便所述数据节点根据所述分布表创建指示创建所述逻辑数据表的分布表。另一方面,本专利技术实施例还提供了一种控制节点,包括:处理单元,用于在数据查询前,根据创建 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种数据分布的方法,其特征在于,包括:在数据查询前,控制节点根据创建规则设置分布表创建指示,所述分布表创建指示中携带逻辑数据表的标识ID以及选定分布列的分布列标识,其中所述选定分布列为所述逻辑数据表中的分布列,所述逻辑数据表为所述控制节点中已创建的逻辑数据表;所述控制节点向数据节点发送所述分布表创建指示,以便所述数据节点根据所述分布表创建指示创建所述逻辑数据表的分布表;所述控制节点根据创建规则设置分布表创建指示,具体包括:所述控制节点判断所述数据节点是否已根据所述逻辑数据表的标识ID以及所述选定分布列的分布列标识创建所述逻辑数据表的分布表;当所述数据节点未根据所述逻辑数据表的标识ID以及所述选定分布列的分布列标识创建所述逻辑数据表的分布表时,所述控制节点将所述逻辑数据表的标识ID以及所述选定分布列的分布列标识添加到所述分布表创建指示中;当所述数据节点已根据所述逻辑数据表的标识ID以及所述选定分布列的分布列标识创建所述逻辑数据表的分布表时,所述控制节点不将所述逻辑数据表的标识ID以及所述选定分布列的分布列标识添加到所述分布表创建指示中。2.根据权利要求1所述的方法,其特征在于,所述控制节点根据创建规则设置分布表创建指示,具体包括:所述控制节点统计在预设周期内所述逻辑数据表的数据,得出统计结果,根据所述统计结果将所述逻辑数据表的标识ID以及所述选定分布列的分布列标识添加到所述分布表创建指示中;或者,所述控制节点接收客户端的创建指示,所述创建指示中携带所述逻辑数据表的标识ID以及所述选定分布列的分布列标识,所述控制节点将所述创建指示中携带的所述逻辑数据表的标识ID以及所述选定分布列的分布列标识添加到所述分布表创建指示中。3.根据权利要求2所述的方法,其特征在于,所述控制节点统计在预设周期内所述逻辑数据表的数据,具体包括:在一个预设周期内,所述控制节点统计下述数据中的至少一项:所述逻辑数据表被查询的次数、所述逻辑数据表中被查询的表项数据占所述逻辑数据表总表项数据的比例以及所述逻辑数据表中分布列被查询的次数;所述根据所述统计结果将所述逻辑数据表的标识ID以及所述选定分布列的分布列标识添加到所述分布表创建指示中,具体包括:当所述逻辑数据表被查询的次数超过第一阈值时,所述控制节点将所述逻辑数据表的标识ID以及所述逻辑数据表中所有分布列的分布列标识添加到所述分布表创建指示中;和/或,当所述逻辑数据表中被查询的表项数据占所述逻辑数据表总表项数据的比例超过第二阈值时,所述控制节点将所述逻辑数据表的标识ID以及所述逻辑数据表中所有分布列的分布列标识添加到所述分布表创建指示中;和/或,当所述逻辑数据表中分布列被查询的次数超过第三阈值时,所述控制节点将所述逻辑数据表的标识ID以及所述逻辑数据表中被查询次数超过所述第三阈值的分布列的分布列标识添加到所述分布表创建指示中。4.根据权利要求3所述的方法,其特征在于,当所述逻辑数据表中分布列对应的分布表被查询的次数小于第四阈值时,所述方法进一步包括:所述控制节点向所述数据节点发送分布表删除指示,所述分布表删除指示携带被查询次数小于所述第四阈值的分布表对应的分布列的分布列标识以及所述逻辑数据表的标识ID,所述分布表删除指示用于指示所述数据节点删除所述被查询次数小于所述第四阈值的分布表。5.一种控制节点,其特征在于,包括:处理单元,用于在数据查询前,根据创建规则设置分布表创建指示,所述分布表创建指示中携带逻辑数据表的标识ID以及选定分布列的分布列标识,其中所述选定分布列为所述逻辑数据表中的分布列,所述逻辑数据表为所述控制节点中已创建的逻辑数据表;发送单元,用于向数据节点发送所述处理单元设置的所述分布表创建指示,以便所述数据节点根据所述分布表创建指示创建所述逻辑数据表的分布表;所...
【专利技术属性】
技术研发人员:吴向阳,曹俊亮,曹莉,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。