【技术实现步骤摘要】
本专利技术属于数据库,具体涉及一种基于量子振幅放大技术的近似查询处理优化方法。
技术介绍
1、在数据库领域中,数据分析师需要实时地对数据进行聚合查询,以快速获取具有商业价值的信息。然而,对海量数据进行聚合查询速度缓慢、成本高昂,难以满足数据分析师的实时性查询需求。不过,大多聚合查询并不需要完全精确的计算结果。为了解决该问题,近似查询处理(approximate query processing,下文简称aqp)通过为聚合查询提供一定精度的近似结果,加快数据的聚合计算速度,从而满足数据分析师的实时查询需求。
2、传统的aqp一般基于在线采样,预聚合或机器学习等方法实现。在线采样方法是指从海量数据中抽样一部分数据进行聚合计算,从而提供聚合查询的近似结果。该类方法的精确度依赖于中心极限定理,即需要假设采样的样本足够大。然而,该假设并非总是成立的,尤其在常见的具有高选择性的分组聚合查询中,此假设将会失效,使得近似结果偏差很大,无法使用(例如,统计各街道人口平均年龄,人口少的街道采样样本小,估计偏差很大)。为此,基于预聚合或机器学习的
...【技术保护点】
1.一种基于量子振幅放大技术的近似查询处理优化方法,其特征在于,包括:
2.如权利要求1所述的基于量子振幅放大技术的近似查询处理优化方法,其特征在于,所述阈值γ为组内数据量估计值的10%~100%。
3.如权利要求1所述的基于量子振幅放大技术的近似查询处理优化方法,其特征在于,对所有组内数据量小于阈值γ的组按序进行分段时,每个数据段中的数据量应当尽可能接近所述基础数据样本的数据量的20%。
4.如权利要求1所述的基于量子振幅放大技术的近似查询处理优化方法,其特征在于,所述S2中,构造的量子电路包括量子随机存储器(Quantum Ra
...【技术特征摘要】
1.一种基于量子振幅放大技术的近似查询处理优化方法,其特征在于,包括:
2.如权利要求1所述的基于量子振幅放大技术的近似查询处理优化方法,其特征在于,所述阈值γ为组内数据量估计值的10%~100%。
3.如权利要求1所述的基于量子振幅放大技术的近似查询处理优化方法,其特征在于,对所有组内数据量小于阈值γ的组按序进行分段时,每个数据段中的数据量应当尽可能接近所述基础数据样本的数据量的20%。
4.如权利要求1所述的基于量子振幅放大技术的近似查询处理优化方法,其特征在于,所述s2中,构造的量子电路包括量子随机存储器(quantum random access memory,qram)、预言机(oracle)和扩散算子(diffusion operator);量子电路内的多次振幅放大过程如下:
5.如权利要求4所述的基于量子振幅放大技术的近似查询处理优化方法,其特征在于,所述预言机需对当前处理的数据段内包含的每个组执行相位反转操作,其中对于任意组a的相位反转操作方法如下:
<...【专利技术属性】
技术研发人员:石蒙,陈刚,伍赛,王新宇,高云君,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。