当前位置: 首页 > 专利查询>湖南大学专利>正文

不确定数据Top-k范围查询方法与装置制造方法及图纸

技术编号:24574124 阅读:37 留言:0更新日期:2020-06-21 00:08
本申请涉及一种不确定数据Top‑k范围查询方法、装置、计算机设备和存储介质,针对待查询需求,获取待查询的约束条件参数和数据集,根据自身运行的线程数量,将数据集划分为多个子数据集,针对每个子数据集根据约束条件参数进行剪枝,构建新数据集,针对新数据集中不确定元组对象举行全局Top‑k概率计算,基于全局Top‑k概率计算结果和约束条件参数中携带的概率阈值,确定查询结果集。整个过程中,采用并行处理的方式提高搜索效率,并且针对数据集进行剪枝,有效缩小查询范围,减少查询过程中不必要的数据处理过程,可以高效实现对不同确定数据Top‑k范围查询。

Query method and device of Top-k range of uncertain data

【技术实现步骤摘要】
不确定数据Top-k范围查询方法与装置
本申请涉及数据查询
,特别是涉及一种不确定数据Top-k范围查询方法、装置、计算机设备和存储介质。
技术介绍
Top-k范围查询问题在数据管理、信息检索、数据流、联机分析技术等领域中都得到了实际应用。传统确定的Top-k范围查询算法检索k个满足分值范围约束R=[r1,r2]的元组对象。在许多实际应用中,针对一个大的产品数据库,顾客只对其中的少量并且满足某个约束的元组对象感兴趣。在一个煤矿监控应用中,需要在煤矿隧道中部署传感器以收集诸如大气压力、空气密度、温度和湿度等。为了保持工人的安全,这些指标必须保持在一个已认证的范围,例如空气温度、湿度和大气压力分别需要维持在[36°F,86°F]、[80%,100%]和[103hpa,108hpa]。煤矿管理者想要以至少75%的概率来检索那些范围内的数据,以便准确掌握煤矿内的环境情况。这就是一个基于用户定义的概率阈值的不确定数据Top-k范围查询难题。尽管基于传统确定数据集的范围查询处理已经得到了较好的研究,但是其解决方法不能直接应用于处理不确本文档来自技高网...

【技术保护点】
1.一种不确定数据Top-k范围查询方法,所述方法包括:/n获取待查询的约束条件参数和数据集;/n根据线程数量,将所述数据集划分为多个子数据集;/n根据所述约束条件参数分别对各所述子数据集进行剪枝,得到各所述子数据集对应的剪枝结果集;/n归集所述剪枝结果集,得到新数据集,计算所述新数据集中不确定元组对象的全局Top-k概率,得到全局Top-k概率计算结果;/n根据所述约束条件参数中携带的概率阈值,选取所述新数据集中全局Top-k概率大于所述概率阈值的不确定元组对象,得到查询结果集。/n

【技术特征摘要】
1.一种不确定数据Top-k范围查询方法,所述方法包括:
获取待查询的约束条件参数和数据集;
根据线程数量,将所述数据集划分为多个子数据集;
根据所述约束条件参数分别对各所述子数据集进行剪枝,得到各所述子数据集对应的剪枝结果集;
归集所述剪枝结果集,得到新数据集,计算所述新数据集中不确定元组对象的全局Top-k概率,得到全局Top-k概率计算结果;
根据所述约束条件参数中携带的概率阈值,选取所述新数据集中全局Top-k概率大于所述概率阈值的不确定元组对象,得到查询结果集。


2.根据权利要求1所述的方法,其特征在于,所述根据所述约束条件参数分别对各所述子数据集进行剪枝,得到各所述子数据集对应的剪枝结果集包括:
根据所述约束条件参数,分别对各所述子数据集依次进行分值范围约束剪枝、概率阈值剪枝、结果集上界剪枝、Top-k概率下界剪枝和局部Top-k概率剪枝。


3.根据权利要求2所述的方法,其特征在于,分值范围约束剪枝和概率阈值剪枝包括:
读取所述约束条件参数中携带的分值范围约束参数和概率阈值;
根据所述分值范围约束参数对各所述子数据集进行分值围约束剪枝、并根据所述概率阈值对各所述子数据集进行概率阈值剪枝,得到各一次剪枝子数据集。


4.根据权利要求3所述的方法,其特征在于,结果集上界剪枝包括:
获取各所述一次剪枝子数据集中不确定元组对象的聚集分值;
对各所述一次剪枝子数据集中不确定元组对象基于聚集分值排序,得到排序后的子数据集;
根据所述概率阈值,对各排序后的子数据集应用查询结果上界剪枝,得到各二次剪枝子数据集。


5.根据权利要求4所述的方法,其特征在于,Top-k概率下界剪枝和局部Top-k概率剪枝包括:
根据所述概率阈值,应用不确定元组对象Top-k概率下界对各所述二次剪枝子数据集剪枝,得到各三次剪枝子数据集;
计算各所述三次剪枝子数据集中不确定元组对象的局部Top-k概率,进行局部Top-k概率剪枝,得到各...

【专利技术属性】
技术研发人员:肖国庆陈玥丹李肯立周旭刘楚波唐卓
申请(专利权)人:湖南大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1