使数据库查询形成聚类以用于运行时间预测制造技术

技术编号：13306778 阅读：63 留言：0更新日期：2016-07-10 02:04

本发明专利技术特别涉及一种计算机实现的用于使数据库中的参考查询形成聚类，从而基于目标查询与参考查询的相似度来预测数据库中的目标查询的运行时间的方法。所述方法包括以下的步骤：提供(S10)表示参考查询的运行时间的多个数值；针对预先确定的聚类的数量，计算数值的最佳K均值聚类形成，其中，计算步骤(S20)包括将应用至其阶数等于所述数值的数量的方块矩阵的线性时间行最小值搜索算法迭代与预先确定的聚类的数量相对应的次数；并且根据计算的所述数值的聚类形成而使参考查询形成聚类。这种方法改进了数据库查询时间预测的领域。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术特别地涉及数据库工程的领域，并且尤其涉及计算机实现的用于使数据库中的参考查询形成聚类的方法、计算机程序、和系统。
技术介绍
数据库工程常常包含关于对数据库的查询的不同种类的优化，并且尤其针对执行工作量预测。执行查询所花费的时间被称为工作量，或简单地称为执行时间、或查询运行时间。这通常是优化器将最小化的量，即使常常必须考虑其他成本，如所使用的存储器空间和资源。重要的是要注意到，回答查询所需要的时间是用于计算查询计划与用于执行查询计划的时间的和。一些技术倾向于寻找这两个量之间的权衡(例如，在文档US20050071331A1中)。查询运行时间预测的最重要的应用是查询优化，所述查询优化依靠这些预测以从常常很大数量的候选者中选择特定的执行计划。在现实世界的应用中，数据库系统在必须一些时间内回答很多查询，这就是为什么其运行查询调度(详见文章“Distribution-BasedQueryScheduling”，作者Chi，Hacigum，Hsiung，Naughton，2013)本文档来自技高网...

【技术保护点】
一种计算机实现的使数据库中的参考查询形成聚类以用于基于所述数据库中的目标查询与所述参考查询的相似度来对所述目标查询的运行时间进行预测的方法，其中，所述方法包括以下的步骤：提供(S10)表示所述参考查询的所述运行时间的多个(n个)数值(x1,...,xn)；针对预先确定的聚类的数量(K个)，计算(S20)所述数值的最佳K均值聚类形成，其中，所述计算步骤(S20)包括将应用至具有等于所述数值的数量的阶数(n)的方块矩阵(H)的线性时间行最小值搜索算法迭代与所述预先确定的聚类的数量相对应的次数；并且根据所述数值的所计算的聚类形成，使所述参考查询形成聚类(S30)。

【技术特征摘要】
2014.12.27 EP 14307192.61.一种计算机实现的使数据库中的参考查询形成聚类以用于基于所述数据库中的目
标查询与所述参考查询的相似度来对所述目标查询的运行时间进行预测的方法，其中，所
述方法包括以下的步骤：
提供(S10)表示所述参考查询的所述运行时间的多个(n个)数值(x1,...,xn)；
针对预先确定的聚类的数量(K个)，计算(S20)所述数值的最佳K均值聚类形成，其中，
所述计算步骤(S20)包括将应用至具有等于所述数值的数量的阶数(n)的方块矩阵(H)的线
性时间行最小值搜索算法迭代与所述预先确定的聚类的数量相对应的次数；并且
根据所述数值的所计算的聚类形成，使所述参考查询形成聚类(S30)。
2.根据权利要求1所述的方法，其中，所述数值(x1,...,xn)被进行排序并相应地被编制
了索引，并且所述计算步骤(S20)内的所述迭代包括，在每个相应的迭代等级(k)并且对于
低于所述数值的数量(n)的每个相应的索引(j)，最小总失真(TDmin(j,k))的计算对于所编
制的索引小于该相应的索引的数值(xi)(i≤j)的子集是能够实现的，其中根据应用至所述
方块矩阵(H)的所述线性时间行最小值搜索算法，聚类的数量对应于相应的迭代等级(k)。
3.根据权利要求2所述的方法，其中，在每个相应的迭代等级(k)并且对于低于所述数
值的数量(n)的每个相应的索引(j)，对于每个行索引(i)和每个列索引(j)，矩阵条目(H(i,
j))对应于以下项的和：
在针对该个行索引之前的索引(i-1)的先前的迭代中计算的最小总失真(TDmin(i-1,k-
1))，以及
在该个行索引和该个列索引之间的所述数值的连续的子集(xi,...,xj)的失真(disto
(i,...

【专利技术属性】
技术研发人员：I·贝勒吉提，
申请(专利权)人：达索系统公司，
类型：发明
国别省市：法国;FR

全部详细技术资料下载我是这个专利的主人