【技术实现步骤摘要】
一种自动学习索引方法及系统
[0001]本专利技术涉及一种学习索引方法及系统,具体涉及一种根据计算机数据特征自动推荐最佳索引的方法及系统,属于数据库索引领域。
技术介绍
[0002]现有计算机索引结构的优化大多是基于计算机数据最差的情况,并且是对读写相对均匀的计算机索引进行优化,所以对于一些特殊的情况,例如,某计算机数据集中的数据按照1
‑
100M顺序排列,由于数据key值本身就可以作为偏移量使用,此时采用常用的B
‑
Tree索引进行计算机数据查询就不是最优解,反而会因为B
‑
Tree的构建增加B
‑
Tree索引的查询时间复杂度和空间复杂度。B
‑
Tree或B+Tree索引结构使用简单的条件判断语句进行递归地划分空间,不考虑每条计算机数据和其索引键值间是否具有联系,也没有利用已知数据的分布特点,因此,它们具有次优的空间代价和查询性能,且在现实中并没有一种已知的计算机数据模式分布可以遵循,就导致求出的实际计算机数据的分布模型的成本开销太大 ...
【技术保护点】
【技术特征摘要】
1.一种自动学习索引方法,其特征在于:它包括以下步骤:S1、获取计算机数据库作为训练集;S2、构建学习索引模型,学习索引模型包括回归模型和随机森林模型,利用训练集对学习索引模型进行训练,输入训练数据的键key,输出训练数据在计算机数据库中的位置,得到训练好的学习索引模型;S3、将待查询的计算机数据输入训练好的学习索引模型内,输出计算机数据在计算机数据库中的位置。2.根据权利要求1中所述的一种自动学习索引方法,其特征在于:S2中回归模型包括线性回归模型,多项式回归模型,弹性回归模型,梯度提升树,极限树。3.根据权利要求2中所述的一种自动学习索引方法,其特征在于:S2中构建学习索引模型,学习索引模型包括回归模型和随机森林模型,利用训练集对学习索引模型进行训练,输入训练数据的键key,输出训练数据在计算机数据库中的位置,得到训练好的学习索引模型,具体过程为:将训练集中某个训练数据的键key分别输入回归模型的线性回归模型,多项式回归模型,弹性回归模型,梯度提升树,极限树内进行训练,每个回归模型均输出某个训练数据键key在计算机数据库中的位置,即得到训练数据在计算机数据库中的位置;训练完成后,记录每个回归模型的训练参数,利用打分函数对每个回归模型的输出结果进行打分,选取打分最高的多个回归模型与某个训练数据建立关联,得到每个训练数据及其对应的...
【专利技术属性】
技术研发人员:王宏志,朱锐,唐亚锋,徐博,
申请(专利权)人:哈尔滨工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。