【技术实现步骤摘要】
本专利技术涉及数据库数据处理,特别涉及一种数据库基数估计方法、装置、设备及介质。
技术介绍
1、基数估计是数据库管理系统查询优化器的核心,基数估计通过估计优化器可能返回的查询的行数,以此来引导查询优化器来选择最佳的查询计划,该操作将直接影响甚至决定查询效率;理论上,只要提供了准确的基数估计和物理计划执行代价,并可以在巨大搜索空间中有效地枚举计划,数据库就可以在合理的时间内制定出最佳查询计划;现阶段的基数估计方法主要包括传统基数估计和学习型基数估计两类,传统基数估计又可分为基于统计和基于采样两个类型,而学习型基数估计又可分为数据驱动、查询驱动、数据驱动和查询驱动混合三个类型。
2、传统基数估计中的基于统计的方法的核心是使用某种数据结构,例如直方图、数据画像来拟合表上的数据分布,采用数据画像来估计数据集中不同元素的个数,使用随机哈希函数并基于随机假设,可以将任意数据集映射成服从均匀分布的随机值序列从而进行估计;基于采样的方法的核心是通过从原始数据集中采样到小数据集来估计数据的整体分布,以反映不同表之间的关联关系,不同于基于统计的
...【技术保护点】
1.一种数据库基数估计方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种数据库基数估计方法,其特征在于,所述根据表信息和列信息生成scan算子节点和join算子节点,并构造查询图,包括:
3.根据权利要求1所述的一种数据库基数估计方法,其特征在于,所述将查询图中每个节点的特征表示为特征向量,并获得每个节点的初始隐藏状态,包括:
4.根据权利要求1所述的一种数据库基数估计方法,其特征在于,所述对每个节点进行消息传递和隐藏状态更新,包括:
5.根据权利要求1所述的一种数据库基数估计方法,其特征在于,所述将每个节点
...【技术特征摘要】
1.一种数据库基数估计方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种数据库基数估计方法,其特征在于,所述根据表信息和列信息生成scan算子节点和join算子节点,并构造查询图,包括:
3.根据权利要求1所述的一种数据库基数估计方法,其特征在于,所述将查询图中每个节点的特征表示为特征向量,并获得每个节点的初始隐藏状态,包括:
4.根据权利要求1所述的一种数据库基数估计方法,其特征在于,所述对每个节点进行消息传递和隐藏状态更新,包括:
5.根...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。