一种高效的多关键词匹配最优路径查询方法技术

技术编号:14680934 阅读:79 留言:0更新日期:2017-02-22 14:06
一种高效的多关键词匹配最优路径查询方法,属于移动互联网与地理信息系统应用领域,它是利用关键词序列路径构造方法和完全多项式时间近似策略方法,对搜索空间中可行解个数进行有效界定;将问题求解的规模由阶乘级别转化为多项式级别,减少搜索过程中间结果的枚举量。本发明专利技术在融合web文本资源与道路热度信息的路网中,针对用户提出的多个检索关键词,行程起点、终点,行程代价预算(时间、距离),为用户高效地搜索匹配关键词,行程起点、终点,行程代价预算查询约束的最优路径,进一步提升KSRG的查询效率。

【技术实现步骤摘要】

本专利技术属于移动互联网与地理信息系统应用领域,特别是地理信息系统中的空间关键词查询与路径搜索相结合的综合查询领域。
技术介绍
随着移动互联网技术与地理定位技术的发展,基于位置的服务在当下被广泛应用于交通、物流、旅游等多个领域。在众多基于位置的服务中,地图服务是一项极为常见的服务。根据位置信息,为用户在路网中查询一条合适的路径,是地图服务中一项重要功能。传统地图服务所提供的路径查询功能,大多局限于在给定起点与终点后单纯返回两点间的最短路径。然而,在Web资源与地图服务结合的背景下,地图上的空间兴趣点不仅包含位置属性,还包含更为丰富的文本描述信息,这些文本信息能详细反映兴趣点所带有的属性与特点。考虑到在不同的出行场景中用户往往对路径的行程体验有不同的需求。显然最短路径查询方法将不再适用于特殊路径查询。为满足用户个性化的路径查询需求,提出针对特殊路径的高效查询方法显得尤为重要。近年来大量有关空间关键词查询的研究提出了多种查询,如:最优k邻居查询(top-kNN)、范围查询(Rangequery)、逆向最邻近查询(ReversekNNquery),这些查询对空间对象的空间临近度与文本相似性进行考察,但查询粒度局限为单一个体,无法解决多个邻接的空间对象组合相连下最优路径问题。CaoXin与ChenLisi等人在欧式空间中提出了满足关键词全包含下的一组邻近空间实体集合的查询,此外CaoXin又与GaoCong等人在路网空间中实现了最优子区域的高效查询算法,上述查询虽然返回一组兴趣点集合,但依然无法适用于以路径形式组合下的兴趣点集合查询。最优路径查询:最优路径查询是基于位置的服务中被广泛研究的一个问题。LiFeifei等人在空间数据库领域中最先提出一种新的查询TPQ(TripPlanQuery),TPQ查询在指定的空间两点间搜索一条经过所有指定类别对象的路径,同时该路径有最短长度。例如,在用户的住处与工作地点间查找一条经过便利店、加油站、银行的最短路径。TPQ查询问题可以视为广义旅行商问题(GTSP)的一个特例,为NP难题。与TPQ问题类似,MehdiSharifzadeh等人提出了OSR(OptimalSequencedRoute)查询问题,该查询搜索一条从空间中的一点出发,按规定类别访问序列,经过所有类别空间对象,且长度最短的路径,例如从用户当前所在的位置出发,找到一条依次经过银行、加油站、影院、便利店的最短路径。由于OSR查询固定了对象的访问顺序,因此该查询为TPQ问题下的一类特殊案例。区别于OSR查询中固定的路径节点访问顺序,ChenHaiquan等人提出了MRPSR(Multi-RulePartialSequencedRout)查询问题,此类查询额外增加了相关类别对象访问顺序的约束,例如用户必须在访问加油站前优先访问银行。JingLi等人提出了BBS与SBS两类算法以解决任意访问规则下最优路径查询问题,相比MRPSR查询中有限的访问顺序约束,该类查询可满足更为多样的访问约束条件。宋晓宇及许鸿飞等人在旅游背景下提出了一种特殊路径查询—体验式路径查询,该类查询在考虑景点流行程度的基础上,搜索一条在短时间内能尽可能经过多种类别的景点,且类别不重复的旅游路径。基于贪婪策略,鲍金玲等人提出了3种高效的旅游行程规划算法,折中了游客的行程预算与景点的流行度,返回一条近似最优的行程路径。在TPQ、OSR、MRPSR查询以及体验式路径查询中,对象的类别属性往往较为单一,且包含的信息量有限,无法准确地表现出空间对象的特点,因而使得路径将难以精确地匹配用户提出的个性化要求。此外由于上述路径查询中忽略了路径代价预算的上界限制,因此不能较好地满足实际生活场景中的行程问题。在鲍金玲等人提出的方法中虽然考虑了路径行程中各类预算条件的满足,但路径中兴趣点选择较为固定,无法适应不同用户提出的多种个性化要求。基于关键词下的最优路径查询:为使规划的路线尽可能贴近用户个性化的行程需求,同时在代价预算上保持一定的合理性,基于关键词下的最优路径查询(Keyword-awareoptimalroutesearch简称KORS)是一种合适的方法。KORS查询问题最早由CaoXin等人在2012年PVLDB的一篇题目为Keyword-awareoptimalroutesearch的论文中提出。与欧式空间下的路径查询不同,KORS查询在路网空间下搜索返回一条覆盖所有用户指定关键词,同时满足行程预算(如费用、时间),且流行度最大的路径。该类路径问题为权值受限最短路径问题(weightconstraintshortestpath)的一个特例,为NP难题,实际路径求解的搜索空间复杂度为O(dn)(d为图中顶点最大出度)。基于邻边拓展的路径生成策略,CaoXin等人在上文中提出的OSScalling和BucketBound算法实现了多项式复杂度下的问题求解。该类算法主要采用邻边拓展的路径构建方法,自起点出发通过不断拓展当前路径终点的所有邻边产生新的子路径,直到路径到达查询终点。该过程将枚举起点与终点间所有可行路径,并最终在可行路径集合中筛选出最优路径。基于邻边拓展的路径生成策略必然能够求得最优路径的精确解,但该类方法执行效率对图规模大小敏感,在路网对应的大图中以此策略执行搜索时,时间复杂度与空间复杂度过高,无法适合实时响应下的路径查询。此外在KORS查询的问题求解中,关键是通过路径拓展构建查询起点和终点间满足查询约束的可行路径,因此当考虑到查询关键词个数较多,起点与终点间最优路径的顶点个数较多,或者部分查询关键词分布密度较小时,邻边拓展下的路径生成策略将产生大量无关的中间路径,造成算法空间开销骤增,可伸缩性变差,所以并非是一种高效的解决方法。
技术实现思路
为解决关键词下的最优路径查询在大图查询以及多关键词查询中存在的复杂度过高、空间开销过大以及伸缩性较差的缺陷,本专利技术提出了基于关键词序列路径构造(KeywordSequenceRouteGeneration简称KSRG)的一种高效的多关键词匹配最优路径查询方法。本专利技术解决其技术问题所采用的技术方案:一种高效的多关键词匹配最优路径查询方法,其特征在于:利用关键词序列路径构造和完全多项式时间近似策略,对地图软件搜索中可行解个数进行有效界定;将问题求解的规模由阶乘级别转化为多项式级别,减少搜索过程中中间结果的枚举量;1.预判局部路径最优权值的边界,去除不可能满足约束条件的中间结果:即采用弗洛伊德算法获得路网图中任意两点之间的最小目标值OS(r)与最小代价值BS(r)的路径;2.构建倒排索引:即抽取路网图中的所有兴趣点关键词构成一个非重的关键词集合,从关键词集合中优先筛选含有关键词的兴趣点;所述关键词集合中的每个关键词对应一个倒排表,记录所有包含关键词的兴趣点集合;所述关键词序列路径构造包括下述内容:首先根据查询关键词获取所有与查询关键词相关的兴趣点;所述关键词相关的兴趣点:即对于查询Q=(vs,vt,ψ,Δ),第一关键词ti∈ψ,给定顶点vm,若vm.ψ包含ti,且BS(σs,m)+BS(σm,t)<Δ,则vm为第二关键词ti对应的关键词顶点,ti对应的所有候选关键词顶点构成集合顶点集V的每个顶点v代表了一个本文档来自技高网
...

【技术保护点】
一种高效的多关键词匹配最优路径查询方法,其特征是利用关键词序列路径构造方法和完全多项式时间近似策略方法,对搜索空间中可行解个数进行有效界定;将问题求解的规模由阶乘级别转化为多项式级别,减少搜索过程中间结果的枚举量。

【技术特征摘要】
1.一种高效的多关键词匹配最优路径查询方法,其特征是利用关键词序列路径构造方法和完全多项式时间近似策略方法,对搜索空间中可行解个数进行有效界定;将问题求解的规模由阶乘级别转化为多项式级别,减少搜索过程中间结果的枚举量。2.根据权利要求1所述一种高效的多关键词匹配最优路径查询方法,其特征是关键词序列路径构造方法包括下述内容:(1)获取与查询关键词相关的所有关键词顶点,起点处初始化拓展关键词路径;(2)求得可行近似解,对解空间进行初步裁剪;(3)选择最小全局优先度pmin对应队列Qpmin中局部优先级最高的路径标签进行关键词路径拓展;(4)进行关键词路径标签检查;(5)重复步骤(3)、(4),当拓展得到覆盖所有查询关键词,且标签全局优先级为最小全局优先级时,该路径标签即为最终结果。3.根据权利要求2所述一种高效的多关键词匹配最优路径查询方法,其特征是所述关键词顶点即对于查询Q=(vs,vt,ψ,...

【专利技术属性】
技术研发人员:牛保宁金鹏飞
申请(专利权)人:太原理工大学
类型:发明
国别省市:山西;14

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1