一种数据处理方法、装置及设备制造方法及图纸

技术编号:26376214 阅读:23 留言:0更新日期:2020-11-19 23:44
本申请提供一种数据处理方法、装置及设备,该方法包括:获取原始执行计划,所述原始执行计划包括多个节点;从所述原始执行计划的节点中选择无法由数据源处理的目标节点;对所述原始执行计划中的目标节点进行等价变换,得到等价执行计划;根据所述原始执行计划和所述等价执行计划确定目标执行计划;将目标执行计划发送给数据源,以使所述数据源执行所述目标执行计划。通过本申请的技术方案,可以合理利用数据源的计算能力,并减小数据传输量,获得更高的查询性能。

【技术实现步骤摘要】
一种数据处理方法、装置及设备
本申请涉及互联网
,尤其涉及一种数据处理方法、装置及设备。
技术介绍
目前,通常会在多个数据源(即数据库)中存储数据,例如,企业的部分数据存储在数据源1中,另一部分数据存储在数据源2中。由于数据分散存储在不同的数据源,因此,需要通过查询系统来连接各个数据源,从各个数据源中读取数据,以支撑跨数据源的数据处理。例如,查询系统可以从数据源1中读取数据,从数据源2中读取数据,并利用读取的这些数据进行处理。但是,如果由查询系统读取数据源1中的所有数据,并读取数据源2中的所有数据,则数据读取的代价很高,最终影响查询系统的整体处理效率。基于此,查询系统通常将部分处理推送至数据源执行,这样,一方面可以利用数据源本身的计算能力,另一方面可以减少数据源返回给查询系统的数据量。然而,针对用户的处理请求,应该将哪些处理推送至数据源执行,目前没有有效的确定方式,无法合理的利用数据源的计算能力,用户体验比较差。
技术实现思路
本申请提供一种数据处理方法,所述方法包括:获取原始执行计划,所述原始本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n获取原始执行计划,所述原始执行计划包括多个节点;/n从所述原始执行计划的节点中选择无法由数据源处理的目标节点;/n对所述原始执行计划中的目标节点进行等价变换,得到等价执行计划;/n根据所述原始执行计划和所述等价执行计划确定目标执行计划;/n将目标执行计划发送给数据源,以使所述数据源执行所述目标执行计划。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
获取原始执行计划,所述原始执行计划包括多个节点;
从所述原始执行计划的节点中选择无法由数据源处理的目标节点;
对所述原始执行计划中的目标节点进行等价变换,得到等价执行计划;
根据所述原始执行计划和所述等价执行计划确定目标执行计划;
将目标执行计划发送给数据源,以使所述数据源执行所述目标执行计划。


2.根据权利要求1所述的方法,其特征在于,
从所述原始执行计划的节点中选择无法由数据源处理的目标节点,包括:
采用树形结构对所述原始执行计划的所述多个节点进行排列;
从所述树形结构的最下层节点开始,从下到上依次进行遍历,一直到遍历出无法由数据源处理的节点,并将遍历的节点确定为所述目标节点。


3.根据权利要求1所述的方法,其特征在于,所述对所述原始执行计划中的目标节点进行等价变换,得到等价执行计划,包括:
对所述原始执行计划中的目标节点进行切分处理,得到能够由数据源处理的第一子节点和无法由数据源处理的第二子节点;利用所述第一子节点和所述第二子节点替换所述原始执行计划中的目标节点,得到等价执行计划。


4.根据权利要求3所述的方法,其特征在于,利用所述第一子节点和所述第二子节点替换所述原始执行计划中的目标节点,得到等价执行计划,包括:
采用树形结构对所述等价执行计划的所述第一子节点和所述第二子节点进行排列,其中,所述第一子节点位于所述第二子节点的下层。


5.根据权利要求1所述的方法,其特征在于,所述对所述原始执行计划中的目标节点进行等价变换,得到等价执行计划,包括:
从所述原始执行计划的节点中确定与所述目标节点对应的父节点;
将所述目标节点上拉为所述父节点的上层节点,得到等价执行计划。


6.根据权利要求5所述的方法,其特征在于,
从所述原始执行计划的节点中确定与所述目标节点对应的父节点,包括:
若采用树形结构对所述原始执行计划的多个节点进行排列,将与所述目标节点连接的上层节点,确定为与所述目标节点对应的父节点。


7.根据权利要求1-6任一项所述的方法,其特征在于,
所述等价执行计划的执行结果与所述原始执行计划的执行结果相同。


8.根据权利要求1所述的方法,其特征在于,
根据所述原始执行计划和所述等价执行计划确定目标执行计划,包括:
确定与所述原始执行计划对应的代价值;
确定与所述等价执行计划对应的代价值;
根据代价值最小的执行计划,确定所述目标执行计划。


9.根据权利要求1所述的方法,其特征在于,获取原始执行计划,包括:
获取数据处理请求,并根据所述数据处理请求获取原始执行计划;或者,
在得到等价执行计划之后,将所述等价执行计划确定为原始执行计划。


10.一种数据处理方法,其特征在于,所述方法包括:
获取原始执行计划,所述原始执行计划包括多个节点;
从所述原始执行计划的节点中选择无法由数据源处理的目标节点;
对所述原始执行计划中的所述目标节点进行切分处理,得到能够由数据源处理的第一子节点以及无法由数据源处理的第二子节点;
利用所述第一子节点和所述第二子节点替换原始执行计划中的目标节点,得到等价执行计划,所述等价执行计划与所述原始执行计划的执行结果相同;
根据所述原始执行计划和所述等价执行计划确定目标执行计划;
将目标执行计划发...

【专利技术属性】
技术研发人员:李韬
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1