当前位置: 首页 > 专利查询>浙江大学专利>正文

基于深度学习的Skyline查询基数估计方法及装置制造方法及图纸

技术编号:35737474 阅读:86 留言:0更新日期:2022-11-26 18:40
本发明专利技术公开了一种基于深度学习的Skyline查询基数估计方法及装置,该方法包括:解析数据库历史查询日志信息,获取给定目标数据集上的Skyline查询及其对应的基数构建训练集;根据目标数据集和训练集的分布信息,分别构建并训练其数据分布学习模型;将训练好的数据分布学习模型的模型参数作为基数估计模型的初始化参数,根据训练集训练基数估计模型;根据训练好的基数估计模型,输入查询点,得到最终的基数估计值。本发明专利技术为Skyline查询变体的基数估计提供解决方案,并确保了Skyline查询变体的基数估计中存在的单调性质,提出了一种高效准确的基数估计方法,拥有准确率高、效率高、鲁棒性强、扩展性强等优点。在现代数据库管理系统以及查询优化等领域有广阔的应用场景。统以及查询优化等领域有广阔的应用场景。统以及查询优化等领域有广阔的应用场景。

【技术实现步骤摘要】
基于深度学习的Skyline查询基数估计方法及装置


[0001]本申请涉及信息检索
,尤其涉及一种基于深度学习的Skyline查询基数估计方法及装置。

技术介绍

[0002]Skyline查询是一个典型的多目标优化问题,能够根据查询者偏好,返回最优的一组数据,是数据库经典的查询之一。Skyline查询在多目标决策问题中有着广泛的应用,如客户信息服务、推荐系统、决策支持和决策系统等,具有极高的现实意义与研究价值。近年来多种Skyline查询变体被相继提出,如动态Skyline查询,反Skyline查询,k

Dominant Skyline查询,k

Skyband查询,ε

Skyline查询等,极大地丰富了传统Skyline查询的内涵,并拓展了Skyline查询的应用场景。
[0003]当这些Skyline操作集成到数据库管理系统时,就涉及Skyline查询基数估计问题,此问题非常重要,因为查询优化器是数据库管理系统不可或缺的组件,而准确高效的基数估计对于查询优化非常关键。查本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的Skyline查询基数估计方法,其特征在于,包括:解析数据库的历史查询日志信息,从中筛选得到目标数据集上的Skyline查询及其对应的基数;根据Skyline查询及其对应的基数构建训练集;根据所述目标数据集和所述训练集的分布信息,分别构建并训练各自的数据分布学习模型;构建基数估计模型,将训练好的数据分布学习模型的模型参数作为基数估计模型的初始化参数,通过所述训练集训练所述基数估计模型;根据训练好的基数估计模型,输入查询点得到最终的基数估计值。2.根据权利要求1所述的方法,其特征在于,所述Skyline查询为动态Skyline查询、反Skyline查询、动态k

Dominant Skyline查询、动态k

Skyband查询或动态ε

Skyline查询。3.根据权利要求1所述的方法,其特征在于,解析数据库的历史查询日志信息,从中筛选得到目标数据集上的Skyline查询及其对应的基数,包括:从历史查询日志信息的查询语句中解析并筛选出目标数据集上的Skyline查询及其对应的基数,其中Skyline查询包括查询点及其查询参数;从Skyline查询的查询结果解析查询结果集的规模,即查询基数。4.根据权利要求1所述的方法,其特征在于,所述数据分布学习模型的构建训练过程,包括:构建深度自注意力变换网络;对所述目标数据集或训练集进行采样、编码后,随机遮掩一定比例的值,得到遮掩后的数据;将所述遮掩后的数据输入到深度自注意力变换网络中进行训练,得到数据分布学习模型,其中模型训练的任务为预测这些遮掩值,模型优化目标是最大化遮掩值的条件似然概率。5.根据权利要求3所述的方法,其特征在于,所述基数估计模型的构建训练过程,包括:1)构建基于查询点的基数估计子模型M
Q
,所述基数估计子模型M
Q
由Transformer、池化层和线性连接层组成的第一深层神经网络,初始参数为训练好的目标数据集上数据分布学习模型的参数;2)构建基于查询参数的基数估计子模型M
P
,所述基数估计子模型M
P
由Transformer,池化层,线性连接层组成的第二深层神经网络,初始参数为训练好的训练集...

【专利技术属性】
技术研发人员:苗晓晔彭佳真吴洋洋尹建伟
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1