【技术实现步骤摘要】
本专利技术一般涉及数据流的处理,更具体地说,涉及在处理数据流中使用的范围查询技术。
技术介绍
可针对快速数据流发出大量的连续范围查询,以便监视各种活动和条件。例如,在金融流应用中,可创建各种连续范围查询,以监视股票和债券的价格和数量。在传感器网络应用中,连续范围查询可被用于监视温度、湿度、交通流量和许多其它读数。注意由于针对输入的数据流重复并且连续地评估这些监视查询,因此它们被称为连续查询。它们与通常只被评估一次的规则查询相反。当数据流以日益快速的速率流动时,连续范围查询的处理变得更困难(即使不是不可能),因为进行监视的计算系统的中央处理器(CPU)的处理能力很快变得有限。数据项可能不得不未处理就被丢弃。即,一些工作量被放弃。但是,更理想的是针对可能快速的数据流,系统处理尽可能多的连续查询。从而,重要的是只针对数据流中的每个数据项,评估潜在相关的查询。快速识别供处理的相关查询的一种方法是使用查询索引。输入流中的每个数据点被用于搜索查询索引,以找出包含该数据点的范围查询。这被称为刺穿(stabbing)查询问题,即,找出由数据点刺入的范围查询。尽管可能概念上简单,不过在流环境中,尤其是如果数据流快速流动,设计有效的二维范围查询索引相当具有挑战性。范围查询索引最好基于主存储器,并且它必须具有两个重要性质低的存储成本和快速的搜索时间。低存储成本重要,使得整个查询索引可被载入主存储器中。从而,在索引搜索操作期间,能够避免由分页引起的潜在性能降低。快速的搜索时间至关重要,使得系统能够处理快速的数据流。范围查询通常难以索引。尽管现有的空间索引,例如R-树(例如参见 ...
【技术保护点】
一种在处理数据流中使用的方法,包含下述步骤:获得将与数据流相关的至少一个范围查询;和利用一个或多个虚拟结构,根据所述至少一个范围查询建立范围查询索引,使得查询索引适应于范围查询大小的分布的一个或多个变化。
【技术特征摘要】
US 2005-6-17 11/155,2211.一种在处理数据流中使用的方法,包含下述步骤获得将与数据流相关的至少一个范围查询;和利用一个或多个虚拟结构,根据所述至少一个范围查询建立范围查询索引,使得查询索引适应于范围查询大小的分布的一个或多个变化。2.按照权利要求1所述的方法,其中建立范围查询索引的步骤还包括下述步骤把与所述至少一个范围查询相关的监视区域分成一个或多个初始级别的虚拟正方形;为每个初始级别的虚拟正方形定义一个或多个级别的虚拟正方形;把所述至少一个范围查询分解成一个或多个虚拟正方形;和使所述至少一个范围查询的标识符与一个或多个分解后的虚拟正方形相关联。3.按照权利要求2所述的方法,其中建立范围查询索引的步骤还包括响应范围查询大小的分布的一个或多个变化,动态调整范围索引的顶级正方形分区的边长的步骤。4.按照权利要求2所述的方法,其中为每个初始级别的虚拟正方形定义一个或多个级别的虚拟正方形的步骤还包括每个虚拟正方形具有一个局部标识符和一个分区标识符。5.按照权利要求2所述的方法,其中为每个初始级别的虚拟正方形定义一个或多个级别的虚拟正方形的步骤还包括每个虚拟正方形具有一组容纳编码的正方形。6.按照权利要求5所述的方法,其中为每个初始级别的虚拟正方形定义一个或多个级别的虚拟正方形的步骤还包括容纳编码的正方形包含四个四分之一大小的容纳编码的正方形。7.按照权利要求6所述的方法,其中为每个初始级别的虚拟正方形定义一个或多个级别的虚拟正方形的步骤还包括容纳编码的正方形具有局部标识符m和具有局部标识符4m、4m+1、4m+2和4m+3的四个四分之一大小的容纳编码的正方形。8.按照权利要求1所述的方法,其中建立范围查询索引的步骤还包括建立范围查询索引,使得范围查询索引适应在所述至少一个范围查询的监视区域之外的查询位置方面的一个或多个变化。9.按照权利要求1所述的方法,还包括利用数据值搜索范围查询索引的步骤。10.按照权利要求9所述的方法,其中利用数据值搜索范围查询索引的步骤还包括下述步骤找出包含数据值的最小尺寸的虚拟正方形;找出包含最小尺寸的虚拟正方形的其它虚拟正方形;和获得与覆盖所述数据值的虚拟正方形相关的查询标识符。11.按照权利要求10所述的方法,其中找出其它虚拟正方形的步骤还包括下述步骤找出最小尺寸的容纳编码的正方形的分区标识符和局部标识符;和重复把局部标识符除以4,以找出包含最小尺寸的容纳编码的正方形的其它容纳编码的正方形的局部标识符。12.一种评估一个或多个移动目标的一个或多个连续范围查询的方法,包括下述步骤利用与所述一个或多个移动目标的一个或多个连续范围查询相关的一个或多个容纳编码的虚拟结构,保持查询索引;和利用所述查询索引增量地评估所述一个或多个连续范围查询。13.按照权利要求12所述的方法,其中增量地评估一个或多个连续范围查询的步骤还包括识别覆盖由一个或多个连续范围查询的评估获得的一个或多个目标的在先位置的最大容纳编码的正方形;识别覆盖所述一个或多个目标的当前位置的最大容纳编码的正方形;根据一个或多个目标的过去位置和当前位置,避免进行关于在相同的容纳编码的正方形边界内的目标位置的一个或多个计算。14.一种在处理数据流中使用的设备,包括存储器;和与所述存储器耦接的至少一个处理器,所述处理器用于(i)获得将与数据流相关的至少一个范围查询;和(ii)利用一个...
【专利技术属性】
技术研发人员:陈世魁,吴坤龙,俞士纶,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。