【技术实现步骤摘要】
一种数据库表连接优化方法、装置、计算设备和存储介质
[0001]本专利技术涉及数据处理
,具体涉及一种数据库表连接优化方法、装置、计算设备和存储介质。
技术介绍
[0002]在关系型数据库里面,每个实体有自己的一张表(table),所有属性都是这张表的字段(field),表与表之间根据关联字段"连接"(join)在一起。所以,表的连接是关系型数据库的核心问题。查询优化表的连接是数据库技术重要的研究领域,表连接次序的选择是影响查询性能的一个重要因素,表连接次序对于减少临时结果的大小是很重要的,因此大部分查询优化器在连接次序上花了很多功夫。基于关系代数理论,自然连接的结合满足结合律,面对等价计算,如何获取代价最小的结合方式成为数据库研究热点。N个表格做自然连接是一个非确定性多项式难题(non
‑
deterministic polynomialhard,NP
‑
hard),当N值变的很大的时候将产生数据库无法承受的代价,因此如何在N值比较大的情况下,代价控制在可接受范围内是亟待解决的技术问 ...
【技术保护点】
【技术特征摘要】
1.一种数据库表连接优化方法,其特征在于,包括:获取待连接表数据,依据所述待连接表数据和数据库代价模型构建有向图模型;依据所述有向图模型确定对应的特征矩阵和邻接矩阵,将所述特征矩阵和所述邻接矩阵通过图卷积网络进行特征提取,得到目标特征数据;将所述目标特征数据输入至transformer模型中,通过transformer模型预测得到有向图模型中的节点路径,依据所述节点路径确定表连接顺序。2.根据权利要求1所述的方法,其特征在于,所述依据所述待连接表数据和数据库代价模型构建有向图模型进一步包括:将待连接表数据输入至数据库代价模型中,利用所述数据库代价模型得到待连接表数据之间的代价信息;以待连接表数据作为节点,依据待连接表数据之间的代价信息设置各个节点之间的边以及边的方向,构建得到有向图模型。3.根据权利要求1所述的方法,其特征在于,所述依据所述有向图模型确定对应的特征矩阵和邻接矩阵进一步包括:获取所述有向图模型中各个节点的表信息,利用各个节点的表信息确定各个节点的节点特征,依据各个节点特征确定特征矩阵;利用待连接表数据之间的代价信息以及待连接表数据的表序列号确定图结构特征,依据所述图结构特征确定邻接矩阵。4.根据权利要求3所述的方法,其特征在于,所述表信息包括以下信息的一项或多项:待连接表数据的表序列号、行数、列数、表字节大小。5.根据权利要求1所述的方法,其特征在于,在所述依据所述有向图模型确定对应的特征矩阵和邻接矩阵之后,所述方法还包括:对所述特征矩阵和所述邻接矩阵进行归一化处理。6.根据权利要求1
‑
5任一项所述的方法,其特征在于,所述通过transformer模型预测得到有向图模型中的节点路径进一步包括:通过所述transformer模型的编码器的自注意力机制抽取所述目标...
【专利技术属性】
技术研发人员:蒋忠强,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。