【技术实现步骤摘要】
基于深度学习的Skyline查询基数估计方法及装置
[0001]本申请涉及信息检索
,尤其涉及一种基于深度学习的Skyline查询基数估计方法及装置。
技术介绍
[0002]Skyline查询是一个典型的多目标优化问题,能够根据查询者偏好,返回最优的一组数据,是数据库经典的查询之一。Skyline查询在多目标决策问题中有着广泛的应用,如客户信息服务、推荐系统、决策支持和决策系统等,具有极高的现实意义与研究价值。近年来多种Skyline查询变体被相继提出,如动态Skyline查询,反Skyline查询,k
‑
Dominant Skyline查询,k
‑
Skyband查询,ε
‑
Skyline查询等,极大地丰富了传统Skyline查询的内涵,并拓展了Skyline查询的应用场景。
[0003]当这些Skyline操作集成到数据库管理系统时,就涉及Skyline查询基数估计问题,此问题非常重要,因为查询优化器是数据库管理系统不可或缺的组件,而准确高效的基数估计对于 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的Skyline查询基数估计方法,其特征在于,包括:解析数据库的历史查询日志信息,从中筛选得到目标数据集上的Skyline查询及其对应的基数;根据Skyline查询及其对应的基数构建训练集;根据所述目标数据集和所述训练集的分布信息,分别构建并训练各自的数据分布学习模型;构建基数估计模型,将训练好的数据分布学习模型的模型参数作为基数估计模型的初始化参数,通过所述训练集训练所述基数估计模型;根据训练好的基数估计模型,输入查询点得到最终的基数估计值。2.根据权利要求1所述的方法,其特征在于,所述Skyline查询为动态Skyline查询、反Skyline查询、动态k
‑
Dominant Skyline查询、动态k
‑
Skyband查询或动态ε
‑
Skyline查询。3.根据权利要求1所述的方法,其特征在于,解析数据库的历史查询日志信息,从中筛选得到目标数据集上的Skyline查询及其对应的基数,包括:从历史查询日志信息的查询语句中解析并筛选出目标数据集上的Skyline查询及其对应的基数,其中Skyline查询包括查询点及其查询参数;从Skyline查询的查询结果解析查询结果集的规模,即查询基数。4.根据权利要求1所述的方法,其特征在于,所述数据分布学习模型的构建训练过程,包括:构建深度自注意力变换网络;对所述目标数据集或训练集进行采样、编码后,随机遮掩一定比例的值,得到遮掩后的数据;将所述遮掩后的数据输入到深度自注意力变换网络中进行训练,得到数据分布学习模型,其中模型训练的任务为预测这些遮掩值,模型优化目标是最大化遮掩值的条件似然概率。5.根据权利要求3所述的方法,其特征在于,所述基数估计模型的构建训练过程,包括:1)构建基于查询点的基数估计子模型M
Q
,所述基数估计子模型M
Q
由Transformer、池化层和线性连接层组成的第一深层神经网络,初始参数为训练好的目标数据集上数据分布学习模型的参数;2)构建基于查询参数的基数估计子模型M
P
,所述基数估计子模型M
P
由Transformer,池化层,线性连接层组成的第二深层神经网络,初始参数为训练好的训练集...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。