【技术实现步骤摘要】
一种预测数据库管理系统的性能的方法、装置及系统
[0001]本申请涉及数据库管理
,具体涉及一种预测数据库管理系统的性能的方法、装置及系统。
技术介绍
[0002]数据库管理系统(database management system,DBMS)针对查询语句的执行性能是数据库管理中一个十分重要的指标,它的优劣会直接影响到实际业务的发展和用户体验。
[0003]针对一个查询语句,DBMS可以生成多种执行计划,每种执行计划对DBMS的性能影响都不同。为了优化DBMS的查询能力,可以预先预测出DBMS执行查询语句时的性能,为该查询语句确定出一种最好的执行计划并配置给DBMS,这样DBMS就可以选择该最好的执行计划来执行该查询语句。
[0004]目前,预测执行查询语句时DBMS的性能的方案有基于规则的查询优化(rule-based optimization,RBO)方案和基于代价的查询优化(cost-based optimizer,CBO)方案等,无论是哪种预测方案都是基于统计信息和经验模型进行优化的,没有考虑实际复杂多变的业务场景,所以预测结果非常不准确。
技术实现思路
[0005]本申请实施例提供一种预测数据库管理系统的性能的方法,可以提高预测数据库管理系统(database management system,DBMS)的性能指标的准确度。本申请实施例还提供了相应的装置及系统。
[0006]本申请第一方面提供一种预测数据库管理系统的性能的方法,包括:确定查询语句的查询计划;根 ...
【技术保护点】
【技术特征摘要】
1.一种预测数据库管理系统的性能的方法,其特征在于,包括:确定查询语句的查询计划;根据所述查询语句和所述查询计划确定多个特征,并从所述多个特征确定至少一个特征集合,所述至少一个特征集合包括与第一性能指标相对应的第一特征集合,所述第一性能指标为描述所述数据库管理系统的多个性能指标中的任意一个;根据所述第一特征集合确定所述第一性能指标的预测结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征集合确定所述第一性能指标的预测结果,包括:将所述第一特征集合输入一个或多个第一预测模型,以得到所述第一性能指标的预测结果,所述一个或多个第一预测模型是使用所述第一性能指标对应的样本特征集合进行模型训练得到的。3.根据权利要求2所述的方法,其特征在于,所述第一预测模型有多个,所述将所述第一特征集合输入一个或多个第一预测模型,以得到所述第一性能指标的预测结果,包括:将所述第一特征集合分别输入到所述多个第一预测模型中的每个第一预测模型,以得到多个预测结果;根据所述多个预测结果确定所述第一性能指标的预测结果。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:根据所述多个预测结果确定所述第一性能指标的预测结果的置信度,所述置信度用于指示所述第一性能指标的预测结果的可信程度。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:根据所述第一性能指标的预测结果的置信度,确定所述第一性能指标的优化策略。6.根据权利要求1-5任一项所述的方法,其特征在于,所述从所述多个特征确定至少一个特征集合,包括:从所述多个特征中确定与所述数据库管理系统的各性能指标相对应的特征,以得到所述至少一个特征集合,其中,每个特征集合通过标签或映射的方式与一个性能指标相对应。7.根据权利要求1-5任一项所述的方法,其特征在于,所述从所述多个特征确定至少一个特征集合,包括:从所述多个特征中确定至少一个结构特征和至少一个特征向量,其中,所述结构特征指示所述查询语句或所述查询计划的结构,所述特征向量是对所述查询计划或所述查询语句编码后得到的向量;从所述至少一个结构特征和所述至少一个特征向量中,确定与所述第一性能指标对应的目标结构特征和目标特征向量;根据所述目标结构特征确定与所述第一性能指标对应的数据编码结构,所述数据编码结构上包括至少一个向量节点;将所述目标特征向量特征添加到所述至少一个向量节点上,以得到所述第一特征集合。8.根据权利要求1-7任一项所述的方法,其特征在于,所述至少一个特征集合还包括第二特征集合,所述第二特征集合与第二性能指标相对应,所述第二特征集合用于确定所述第二性能指标的预测结果。
9.根据权利要求2-5任一项所述的方法,其特征在于,所述方法还包括:根据与所述第一性能指标相对应的有效性能特征集合更新所述一个或多个第一预测模型,所述有效性能特征集合包括可靠程度满足预设条件的至少一个有效性能特征。10.根据权利要求9所述的方法,其特征在于,所述方法还包括:获取与所述第一性能指标对应的多个历史性能特征,其中,每个历史性能特征包含该历史性能特征产生的时间戳;针对每个历史性能特征,获取从所述时间戳所指示的时刻到所述至少一个第一预测模型的更新时刻所发生的关键性能事件;根据所述关键性能事件的数量,从所述多个历史性能特征中确定所述有效性能特征,所述关键性能事件越多的历史性能特征的可靠程度越低。11.一种预测模型训练的方法,其特征在于,包括:获取多对历史查询语句和历史查询计划;根据每对历史查询语句和历史查询计划确定一个包含多个特征的样本集合,并从每个样本集合确定至少一个特征集合,所述至少一个特征集合包括与第一性能指标相对应的第一特征集合,所述第一性能指标为描述所述数据库管理系统的多个性能指标中的任意一个;使用从所述多个样本集合中确定出的多个第一特征集合对与所述第一性能指标对应的预测模型进行训练,以得到第一预测模型。12.根据权利要求11所述的方法,其特征在于,所述至少一个特征集合还包括第二特征集合,所述第二特征集合与第二性能指标相对应,所述第二性能指标对应的预测模型与所述第一预测模型的结构相同,所述方法还包括:在所述第一预测模型的基础上,初始化所述第二性能指标对应的预测模型;使用从所述多个样本集合中确定出的多个第二特征集合,对初始化的与所述第二性能指标对应的预测模型进行训练,以得到第二预测模型,所述第二预测模型用于预测所述第二性能指标的预测结果。13.根据权利要求11或12所述的方法,其特征在于,所述从每个样本集合确定至少一个特征集合,包括:从所述每个样本集合的多个特征中与所述数据库管理系统的各性能指标相对应的特征,以得到所述至少一个特征集合,其中,每个特征集合与一个性能指标通过标签或映射的方式相对应。14.根据权利要求11或12所述的方法,其特征在于,所述从每个样本集合确定至少一个特征集合,包括:从所述每个样本集合的多个特征中确定至少一个结构特征和至少一个特征向量,其中,所述结构特征用于指示所述历史查询语句或所述历史查询计划的结构,所述特征向量是对所述查询计划或所述查询语句编码后得到的向量;从所述至少一个结构特征和所述至少一个特征向量中,确定与所述第一性能指标对应的目标结构特征和目标特征向量;根据所述目标结构特征确定与所述第一性能指标对应的数据编码结构,所述数据编码结构上包括至少一个向量节点;
将所述目标特征向量添加到所述至少一个向量节点上,以得到所述第一特征集合。15.根据权利要求11-14任一项所述的方法,其特征在于,所述根据每对历史查询语句和历史查询计划确定一个包含多个特征的样本集合,包括:从每对历史...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。