当前位置: 首页 > 专利查询>宁夏大学专利>正文

一种数据库基数估计方法、装置、设备及介质制造方法及图纸

技术编号:44845780 阅读:30 留言:0更新日期:2025-04-01 19:41
本发明专利技术公开了一种数据库基数估计方法、装置、设备及介质,涉及数据库数据处理技术领域,本发明专利技术首先定义了独特的scan算子节点和join算子节点,将复杂的查询类型和查询模式进行清晰表示,而后构建能代表整张数据表的查询图,对查询图中的节点进行特征编码和特征初始化,然后输入图神经网络GNN进行消息传递和隐藏状态更新,在消息传递完成后,通过全局聚合将所有节点的嵌入表示合并成一个图向量,该图向量包含了整个查询图的全局结构和语义信息,最后利用多层感知机MLP输出最终的基数估计值,该过程在查询图构建后,使用图神经网络嵌合了查询图中各个节点之间的隐藏信息,对复杂的查询结构有非常强的模型泛化能力,消除了在基数估计时的预测偏差。

【技术实现步骤摘要】

本专利技术涉及数据库数据处理,特别涉及一种数据库基数估计方法、装置、设备及介质


技术介绍

1、基数估计是数据库管理系统查询优化器的核心,基数估计通过估计优化器可能返回的查询的行数,以此来引导查询优化器来选择最佳的查询计划,该操作将直接影响甚至决定查询效率;理论上,只要提供了准确的基数估计和物理计划执行代价,并可以在巨大搜索空间中有效地枚举计划,数据库就可以在合理的时间内制定出最佳查询计划;现阶段的基数估计方法主要包括传统基数估计和学习型基数估计两类,传统基数估计又可分为基于统计和基于采样两个类型,而学习型基数估计又可分为数据驱动、查询驱动、数据驱动和查询驱动混合三个类型。

2、传统基数估计中的基于统计的方法的核心是使用某种数据结构,例如直方图、数据画像来拟合表上的数据分布,采用数据画像来估计数据集中不同元素的个数,使用随机哈希函数并基于随机假设,可以将任意数据集映射成服从均匀分布的随机值序列从而进行估计;基于采样的方法的核心是通过从原始数据集中采样到小数据集来估计数据的整体分布,以反映不同表之间的关联关系,不同于基于统计的基数估计方法,基于采本文档来自技高网...

【技术保护点】

1.一种数据库基数估计方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种数据库基数估计方法,其特征在于,所述根据表信息和列信息生成scan算子节点和join算子节点,并构造查询图,包括:

3.根据权利要求1所述的一种数据库基数估计方法,其特征在于,所述将查询图中每个节点的特征表示为特征向量,并获得每个节点的初始隐藏状态,包括:

4.根据权利要求1所述的一种数据库基数估计方法,其特征在于,所述对每个节点进行消息传递和隐藏状态更新,包括:

5.根据权利要求1所述的一种数据库基数估计方法,其特征在于,所述将每个节点更新后的隐藏状态和特...

【技术特征摘要】

1.一种数据库基数估计方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种数据库基数估计方法,其特征在于,所述根据表信息和列信息生成scan算子节点和join算子节点,并构造查询图,包括:

3.根据权利要求1所述的一种数据库基数估计方法,其特征在于,所述将查询图中每个节点的特征表示为特征向量,并获得每个节点的初始隐藏状态,包括:

4.根据权利要求1所述的一种数据库基数估计方法,其特征在于,所述对每个节点进行消息传递和隐藏状态更新,包括:

5.根...

【专利技术属性】
技术研发人员:高锦涛刘洋梁璞胡志远
申请(专利权)人:宁夏大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1