基于深度图压缩算法的并行查询表现预测系统及方法技术方案

技术编号：25396961 阅读：58 留言：0更新日期：2020-08-25 23:02

本发明专利技术公开了一种基于深度图压缩算法的并行查询表现预测系统及创建和使用方法，该系统包括：查询预处理模块，用于对并行查询信息进行提取，并更新负载图的节点和边特征，以及对负载图进行合并；在线预测模块，用于利用模型计算出负载图上并行查询的执行特征；离线训练模块，用于利用历史数据训练深度图压缩模型和深度学习模型以学习模型的参数。该系统可以较准确地预测数据库中并行查询的执行表现。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度图压缩算法的并行查询表现预测系统及方法
本专利技术涉及信息检索
，特别涉及一种基于深度图压缩算法的并行查询表现预测系统及方法。
技术介绍
在数据库系统中，预测查询任务的执行表现对于满足服务等级协议(Service-LevelAgreement，SLA)有非常重要的意义，如可以应用到负载调度、参数调优、进程监控等多种优化任务中。然而，现有的预测方法主要面向串行查询，不能高效的预测并行执行的查询任务表现。一个主要原因就是他们没有考虑并行执行的查询任务之间复杂的关联关系，如数据共享、读写冲突等。这些关联关系会显著的影响查询任务实际的执行表现。尽管有一些支持并行查询预测的传统方法，他们主要面临两个问题。首先，传统方法主要通过统计查询任务执行过程中的逻辑指标(如页访问延迟等)来估计执行时间，不仅浪费较长的时间用于监控统计指标，而且忽略了资源/数据竞争(如读写冲突导致的访问锁机制)造成的执行时间差异。其次，一些方法基于数据库提供的查询计划进行表现预测，没有对目标任务和并行任务之间的潜在执行关系进行编码，导致在负载变化时预测精度变差。因此，在预测并行执行的查询表现过程中，主要面临两个方面的挑战：(1)如何对并行执行的查询任务进行建模。直观来说，为了预测执行时间等表现特征，需要对查询任务的执行过程中可能影响最终表现的因素进行建模，如物理层面的执行逻辑，物理算子的特性等。然而，现有方法，一方面不能有效的评估执行过程中并行任务可能造成的影响，如共享数据可能加速执行，抢占内存导致执行变慢等；另一方面，...

【技术保护点】
1.一种基于深度图压缩算法的并行查询表现预测系统，其特征在于，包括：查询预处理模块、在线预测模块和离线训练模块；/n所述查询预处理模块，用于对并行查询信息进行提取，并更新负载图的节点和边特征，以及对负载图进行合并；/n所述在线预测模块，用于利用模型计算出负载图上并行查询的执行特征；/n所述离线训练模块，用于利用历史数据训练深度图压缩模型和深度学习模型以学习模型的参数。/n

【技术特征摘要】
1.一种基于深度图压缩算法的并行查询表现预测系统，其特征在于，包括：查询预处理模块、在线预测模块和离线训练模块；
所述查询预处理模块，用于对并行查询信息进行提取，并更新负载图的节点和边特征，以及对负载图进行合并；
所述在线预测模块，用于利用模型计算出负载图上并行查询的执行特征；
所述离线训练模块，用于利用历史数据训练深度图压缩模型和深度学习模型以学习模型的参数。

2.根据权利要求1所述的基于深度图压缩算法的并行查询表现预测系统，其特征在于，所述在线预测模块和所述离线训练模块为基于深度图压缩算法和深度神经网络的表现预测器。

3.根据权利要求1所述的基于深度图压缩算法的并行查询表现预测系统，其特征在于，所述查询预处理模块进一步包括：查询编码模块、图更新模块和图合并模块；
所述查询编码模块，用于从给定的并行查询信息中提取执行计划中的有用信息；具体为使用数据库优化器将原查询语句解析成执行计划树，将所述执行计划树上的每个算子节点信息编码成特征向量；
所述图更新模块，用于使用当前的查询信息更新负载图上的节点和边特征；具体为根据先负载图上节点的结束时间更新或删除执行中或执行完毕的节点，然后添加新提交的算子节点和相应的边关系；
所述图合并模块，用于通过合并存在时间重叠的节点以减小负载图的规模，具体为先根据每个节点的执行时间范围将存在时间重叠的节点进行聚类，再通过最少完全连接子图划分，在各个类内将没有边关系的节点合并为一个节点。

4.根据权利要求1所述的基于深度图压缩算法的并行查询表现预测系统，其特征在于，所述在线预测模块进一步包括：图特征压缩模块和表现预测模块；
所述图特征压缩模块，用于将原始图解析成每个节点的特征集合，具体为利用深度图压缩模型针对每个节点的k跳内子图结构进行特征选择和压缩，通过前向传播将k跳子图结构信息映射到低维特征向量；
所述表现预测模块，用于根据每个节点的子图特征预测执行表现，具体为利用深度学习模型从历史数据中学习从节点的子图特征映射到执行表现的拟合函数。

5.根据权利要求1所述的基于深度图压缩算法的并行查询表现预测系统，其特征在于，
所述深度图压缩模型指的是利用图卷积网络，提取每个节点上的k跳内邻居信息，利用图卷积技术将节点和邻居特征映射到表示执行性能的抽象空间中，学习的过程指的是根据每张负载图上部分的节点信息更新图网络的参数...

【专利技术属性】
技术研发人员：李国良，周煊赫，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人