当前位置: 首页 > 专利查询>山东大学专利>正文

一种自适应多表连接基数估计的方法和系统技术方案

技术编号:37643664 阅读:16 留言:0更新日期:2023-05-25 10:10
本发明专利技术属于连接基数估计领域,提供了一种自适应多表连接基数估计的方法和系统。其中,自适应多表连接基数估计的方法包括接收输入的查询语句并分析其包含关系及多表连接的连接关系;将查询语句的分析结果进行特征向量化,再基于基数估计模型预测出查询语句的基数;将查询语句转化为数据库查询提示,通过该提示操作的查询优化器,执行查询语句,得出真实基数值;将查询语句的分析结果对应的特征向量及真实基数值构成训练样本,并对基数估计模型再训练,以学习多表联合查询相关性,用于下次连接基数的估计。次连接基数的估计。次连接基数的估计。

【技术实现步骤摘要】
一种自适应多表连接基数估计的方法和系统


[0001]本专利技术属于连接基数估计领域,尤其涉及一种自适应多表连接基数估计的方法和系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]查询优化是数据库管理系统的核心之一,涉及数据库查询执行计划树的构建、计划树节点处具体实现方式的选择、参数的选择、编译执行的选择等。查询优化器主要由基数估计、成本模型、计划枚举三个组件构成。在查询优化阶段输入SQL语句经过分析和检查之后得到语法树。数估计模块预测在单表的筛选条件下该表剩余行数或在多表连接的筛选条件下连接后的表剩余行数。基数估计是查询优化的重要组成部分,该模块的输出将会用于成本模型中估计每个查询方案中表的行数、方案的执行时间,从而在计划枚举空间中选择一个能够高效执行该查询的查询计划,使接下来的查询执行的效率得到提升。
[0004]传统的基数估计研究的挑战在于相关谓词涉及不同表中的列的查询,这些列通过join连接,称之为“多表联合查询相关性”。多表连接基数估计的先验知识存在不易本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种自适应多表连接基数估计的方法,其特征在于,包括:接收输入的查询语句并分析其包含关系及多表连接的连接关系;将查询语句的分析结果进行特征向量化,再基于基数估计模型预测出查询语句的基数;将查询语句转化为数据库查询提示,通过该提示操作的查询优化器,执行查询语句,得出真实基数值;将查询语句的分析结果对应的特征向量及真实基数值构成训练样本,并对基数估计模型再训练,以学习多表联合查询相关性,用于下次连接基数的估计。2.如权利要求1所述的自适应多表连接基数估计的方法,其特征在于,所述基数估计模型为多集卷积网络模型。3.如权利要求2所述的自适应多表连接基数估计的方法,其特征在于,在多集卷积网络模型中,表、连接和谓词表示为单独的模块,每个集合元素由一个两层神经网络组成,具有共享参数;模块输出依次经平均和串联操作后,馈送至最终输出网络。4.如权利要求1所述的自适应多表连接基数估计的方法,其特征在于,将查询语句的分析结果进行特征向量化的过程为:将查询语句的分析结果进行编码且表示成唯一的one

hot向量;再将one

hot向量进行标准化。5.一种自适应多表连接基数估计的系统,其特征在于,包括:查询语句分析模块,其用于接收输入的查询语句并分析其包含关系及多表连接的连接关系;连接基数预测模块,其用于将查询语句的分析结果进行特征向量化,再基于基数估计模型预测出查询语句的基数;真实基数确定模块,其用于将查询语句转化为...

【专利技术属性】
技术研发人员:彭朝晖陈倩马桢王一博
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1