路网上的弹性聚合最近邻查询E-max方法技术

技术编号:19388843 阅读:28 留言:0更新日期:2018-11-10 02:00
本发明专利技术公开了一种路网上的弹性聚合最近邻查询E‑max方法,包括如下步骤:第一步,定义和初始化;第二步,从队列列表的每个队列中取出第一个元素的距离,得到一个序列(d1,d2,…,dM);第三步,取得第二步序列中的最小元素对应的V中点的v,并为v的计数器加1;第四步,判断v的计数器大小,如果计数器大于等于

Resilient aggregation nearest neighbor query E-max method on road network

The invention discloses an elastic aggregation nearest neighbor query E Max method on a road network, which comprises the following steps: first step, definition and initialization; second step, extracting the distance of the first element from each queue in the queue list, and obtaining a sequence (d1, d2,... The third step is to get the v-midpoint corresponding to the smallest element in the second step sequence and add 1 to the counter of V. The fourth step is to determine the counter size of V if the counter is larger than or equal to

【技术实现步骤摘要】
路网上的弹性聚合最近邻查询E-max方法
本专利技术属于计算机领域,具体涉及空间数据库的查询方法,尤其涉及一种路网上的弹性聚合最近邻查询E-max(精确解-最大值)方法。
技术介绍
聚合最近邻查询(Aggregatenearestneighbor,以下简称ANN)是空间数据库中的经典查询,有广阔的应用场景,比如基于位置服务等。给定一组查询点集合Q,ANN在数据点集合V中寻找一个点,使得该点到Q中所有点的聚合距离最小。这个聚合函数一般是max或者sum。ANN问题已经在欧式空间[参见D.Papadias,Q.Shen,Y.Tao,andK.Mouratidis,“Groupnearestneighborqueries,”inDataEngineering,2004.Proceedings.20thInternationalConferenceon.IEEE,2004,pp.301–312.]和路网上[参见D.Papadias,Q.Shen,Y.Tao,andK.Mouratidis,“Groupnearestneighborqueries,”inDataEngineering,2004.Proceedings.20thInternationalConferenceon.IEEE,2004,pp.301–312.]得到研究。在很多时候,考虑Q中的部分查询点则更有意义。考虑图1中的例子,数据点集合是V={v1,v2,…,v8,v9,}(圆形),查询点集合是Q={q1,q2,q3,q4}(三角形)。注意v3和q3,v5和q4分别共享同一个位置;q1位于(v2,v3)上,q2位于(v3,v6)上。假设V是建造港口的候选位置,Q是小型货运集散中心,且每个集散中心每天能存储1吨货物。现在V中寻找一个候选点,收集Q所有货物,并使得聚合距离最小。这时max-ANN的结果就是v2,距离为16;sum-ANN的结果也是v2,距离为52。因为v2相对是Q的“中心”,所以我们可以直观地理解这个结果。但是,如果港口每天仅需要2吨货物,即仅需要考虑50%的小型货物集散中心,而不是考虑Q中所有查询点。更准确地说,更一般的查询是允许用户指定一个参数目标是在V中寻找一个点,使得该点到Q中某个点的聚合距离最小,我们把这种查询称为弹性聚合最近邻查询(flexibleaggregatenearestneighbor,以下简称FANN)。如果我们令则max-FANN的结果是v3,距离为2;sum-FANN的结果也是v3,距离为4。本专利技术研究路网上的FANN问题。FANN查询最早是在欧式空间中提出[参见Y.Li,F.Li,K.Yi,B.Yao,andM.Wang,“Flexibleaggregatesimilaritysearch,”inProceedingsofthe2011ACMSIGMODinternationalconferenceonmanagementofdata.ACM,2011,pp.1009–1020.]。相比与欧式空间,路网上的很多操作都更复杂。比如在欧式空间中确定两点间的最短距离可以在常数时间内确定,而在路网中该操作取决于最短路算法。为了在路网中提出更高效的FANN算法,有必要利用路网的拓扑结构,从而对不可能的候选点进行剪枝。据了解,目前没有其他在路网上关于FANN的研究工作。我们对FANN的研究并不是路网上ANN[参见D.Papadias,Q.Shen,Y.Tao,andK.Mouratidis,“Groupnearestneighborqueries,”inDataEngineering,2004.Proceedings.20thInternationalConferenceon.IEEE,2004,pp.301–312.]的简单扩展。[D.Papadias,Q.Shen,Y.Tao,andK.Mouratidis,“Groupnearestneighborqueries,”inDataEngineering,2004.Proceedings.20thInternationalConferenceon.IEEE,2004,pp.301–312.]中的IER算法依赖R树,但R树在路网上表现并不好。[D.Yan,Z.Zhao,andW.Ng,“Efficientalgorithmsforfindingoptimalmeetingpointonroadnetworks,”ProceedingsoftheVLDBEndowment,vol.4,no.11,2011.]使用了凸包的方法来对不可能的点进行剪枝,但其可扩展性不好。[M.Safar,“Groupk-nearestneighborsqueriesinspatialnetworkdatabases,”Journalofgeographicalsystems,vol.10,no.4,pp.407–416,2008.][L.Zhu,Y.Jing,W.Sun,D.Mao,andP.Liu,“Voronoi-basedaggregatenearestneighborqueryprocessinginroadnetworks,”inProceedingsofthe18thSIGSPATIALInternationalConferenceonAdvancesinGeographicInformationSystems.ACM,2010,pp.518–521.]均使用Voronoi图对路网进行分区,但他们常导致划分的不均衡,从而导致效率不高。此外,由于新加入的参数FANN的结果会更难找到。Q中的任意点均能成为目标,其规模可达因此,亟需研发一种能解决路网上的FANN问题的方法。
技术实现思路
本专利技术要解决的技术问题在于提供一种路网上的弹性聚合最近邻查询E-max(精确解-最大值)方法,该方法能大大较少减少了的调用次数,从而提升查询速度,降低成本。为解决上述技术问题,本专利技术采用如下技术方案:本专利技术提供一种路网上的弹性聚合最近邻查询E-max方法,包括如下步骤:第一步,定义和初始化:定义路网G=(V,E,W),其中V表示顶点,E表示边,W表示边的权重,δ(vi,vj)表示vi到vj的路网距离;Q是查询集合,大小为M;FANN查询定义为:一个FANN查询是一个五元组返回一个三元组使得:其中p*是V中使得弹性聚合距离最小的点,是Q的最优的弹性子集,r*就是此时的弹性聚合距离;定义为弹性聚合函数,它接受一个属于V的点p,一个V的子集Q作为输入,返回一个对作为结果,满足:其中是Q的一个子集且初始化:将r*初始化为无穷大;V中所有的点均未被访问;初始化队列列表(L1,L2,…,LM),即对于Q中的每个点qi,分别生成一个优先级队列,每个队列均包含V中的所有点;为V中每个点加一个计数器,计数器初始为0;第二步,从上述队列列表的每个队列中取出第一个元素的距离,得到一个序列(d1,d2,…,dM);第三步,取得第二步序列(d1,d2,…,dM)中的最小元素对应的V中点的v,并为v的计数器加1;第四步,判断v的计数器大小,如果计数器大于等于则v就是p*,运行就是最终解,结束算法;否则把v从其所在队列L中出本文档来自技高网
...

【技术保护点】
1.一种路网上的弹性聚合最近邻查询E‑max方法,其特征在于,包括如下步骤:第一步,定义和初始化:定义路网G=(V,E,W),其中V表示顶点,E表示边,W表示边的权重,δ(vi,vj)表示vi到vj的路网距离;Q是查询集合,大小为M;FANN查询定义为:一个FANN查询是一个五元组

【技术特征摘要】
1.一种路网上的弹性聚合最近邻查询E-max方法,其特征在于,包括如下步骤:第一步,定义和初始化:定义路网G=(V,E,W),其中V表示顶点,E表示边,W表示边的权重,δ(vi,vj)表示vi到vj的路网距离;Q是查询集合,大小为M;FANN查询定义为:一个FANN查询是一个五元组返回一个三元组使得:其中p*是V中使得弹性聚合距离最小的点,是Q的最优的弹性子集,r*就是此时的弹性聚合距离;定义为弹性聚合函数,它接受一个属于V的点p,一个V的子集Q作为输入,返回一个对作为结果,满足:其中是Q的一个子集且初始化:将r*初始化为无穷大;V中所有的点均未被访问;初始化队列列表(L1,L2,…,LM),即对于Q中的每个点qi,分别生成一个优先级队列,每个队列均包含V中的所有点;为V中每个点加一个计数器,计数器初始...

【专利技术属性】
技术研发人员:过敏意姚斌陈中普郑文立冷静文
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1