基于旅游目标地域来挖掘旅游路线的方法和设备技术

技术编号:11185459 阅读:73 留言:0更新日期:2015-03-25 14:07
本发明专利技术公开了一种基于旅游目标地域来挖掘旅游路线的方法和设备。旅游路线以景点序列的形式表示。该方法包括:检索涉及旅游目标地域的旅游文章;针对各篇旅游文章,分别获得由其中包含的景点构成的景点序列;筛选包含一个或多个特定景点的景点序列,作为针对旅游目标地域的备选景点序列(可以推荐给用户的旅游线路)。通过本发明专利技术的方法和设备,可以从互联网上海量的旅游文章中获取由于大量用户采用而值得向用户推荐的旅游线路。

【技术实现步骤摘要】

本专利技术涉及互联网领域,特别涉及基于旅游目标地域来挖掘旅游路线的方法和设备
技术介绍
人们对于旅游的需求已经不能满足于跟随旅行团的出游。与跟团游的诸多限制相比,人们更加喜欢自己设计旅行路线,然后自由出行。一些旅游网站采集了大量旅游景点的信息,并且自行设计了一些旅游路线。用户可以在网站上输入一些条件,例如希望旅游的景点、出游时间等,然后在网站的协助下,设计旅游路线。但是,一方面,这些旅游景点信息的收集和整理以及旅游路线的预先设计需要大量人工;另一方面,这里人为设定的一些参数(例如景点热门程度、推荐指数等)是基于工作人员的经验和感受设置的,有可能偏离实际游客的经验和感受。因此,人们会更多的通过搜索引擎来搜索前人在网上提供的旅游信息,例如游记、旅游攻略等,当然也包括旅游网站上提供的相关信息(可以统称为“旅游文章”)。人们期望通过浏览所检索到的相关网页或文章来确定自己的旅游路线。事实上,在搜索引擎中,用户对于旅游的搜索需求也的确占据了一个很大的比例。然而,在这个信息爆炸的时代,即便是通过使用搜索引擎,所能得到的旅游文章也很繁杂。用户需要大量的阅读和再加工,才能确定旅游路线。这将是费时费力的。从搜索查寻(Query)分析看,有的用户是针对某个景点的旅游需求,例如:用户搜索“西湖旅游”;有的用户是针对某个城市的旅游需求,例如:用户搜索“杭州旅游”。这一类可以算用户对于要游玩的目的(或者说,“旅游目标地域”)是非常明确的。传统搜索引擎通过提供聚合结构化数据,可以满足用户的常规需求,例如:对于某个景点和某个城市的旅游需求,传统搜索引擎通过一些结构化的数据进行组织表达,基本可以达到能让用户更便捷获取信息的目的。但是这些结构化数据对于用户来说仍然有较大的使用成本,用户旅游在进行行程挖掘时,需要从搜索引擎提供的成百上千条攻略游记中自行归纳和整理,这并不能很好的满足用户的需求。因此,仍需要一种能够为用户推荐高质量的旅游线路的方法和设备
技术实现思路
本专利技术所要解决的一个技术问题是提供一种基于旅游目标地域来挖掘旅游路线的方法和设备,其能够自行挖掘分析高质量的旅游线路。在本公开的上下文中,旅游路线以景点序列的形式表示。根据本专利技术的一个方面,提供了一种基于旅游目标地域来挖掘旅游路线的方法,旅游路线以景点序列的形式表示,该方法包括:检索涉及旅游目标地域的旅游文章;针对各篇旅游文章,分别获得由其中包含的景点构成的景点序列;筛选包含一个或多个特定景点的景点序列,作为针对旅游目标地域的备选景点序列。备选景点序列可以作为能够推荐给用户的旅游线路。通过本专利技术的方法,可以从互联网上海量的旅游文章中获取由于大量用户采用而值得向用户推荐的旅游线路(备选景点序列)。优选地,该方法还可以包括:根据预定序列评分规则,为每个备选景点序列设置景点序列分值,并且按景点序列分值从高到低的顺序将多个所述备选景点序列排序,以便响应于来自客户端的请求而按此顺序提供给客户端。通过为每个备选景点序列设置景点序列分值,可以根据实际需要,进一步提高为用户推荐旅游路线的效率。优选地,预定序列评分规则可以基于以下特征中的至少一项:时间合理性;是否存在重复景点;热门景点所占比例;冷门景点所占比例;旅行强度;以及线路长度。优选地,该方法还可以包括:响应于来自客户端的包含表示旅游意向的旅游特征词和表示旅游目标地域的旅游目标地域词的搜索请求,确定旅游目标地域;以及基于所确定的旅游目标地域,向客户端提供备选景点序列中的至少一个。由此,可以通过与客户端通信来向用户推荐旅游路线。优选地,该方法还可以包括:基于来自客户端的旅游条件信息、包含特定景点的数量以及景点序列分值,计算备选景点序列的相关性分值,其中,基于相关性分值,向客户端提供备选景点序列中的至少一个。由此,可以更有针对性地向用户推荐旅游线路。优选地,该方法还可以包括:滤除包含景点黑名单上的景点的景点序列。通过滤除景点黑名单上的景点所涉及的景点序列,可以进一步提高为用户推荐旅游路线的效率。优选地,获得景点序列的步骤可以包括:在旅游文章中查找与景点的游览时间相关的游览时间信息;在没有查找到游览时间信息的情况下,根据旅游文章中出现次序相邻的两个景点之间的距离和/或从第三方获取的游览时间建议,估计与各景点对应的游览时间信息;在查找到游览时间信息的情况下,从旅游文章中提取与各景点对应的游览时间信息;以及通过使各景点和与其对应的游览时间信息相关联来形成景点序列。通过使得在景点序列中包含了游览时间信息,更有助于用户规划旅游方案。优选地,该方法还可以包括:根据预定景点评分规则为景点分别设置景点分值,并基于景点分值设定特定景点;和/或向客户端提供旅游文章中包含的至少部分景点的列表,并将用户从列表中选择的景点设定为特定景点。通过基于景点分值设定特定景点和/或根据用户选择设定特定景点,可以确保在所推荐的景点序列(旅游线路)中包含有最值得推荐的景点和/或用户特别希望游玩的景点。优选地,预定景点评分规则可以基于以下特征中的至少一项:景点的搜索页面浏览量;针对景点的搜索量;包含该景点的景点序列数量;以及第三方对该景点的评价。通过根据景点评分来设定特定景点,可以自动准备好包括值得推荐的景点的景点序列(旅游路线)。通过根据用户的选择来设定特定景点,可以更加有针对性地准备好用户感兴趣的景点序列(旅游路线)。根据本专利技术的另一个方面,提供了一种基于旅游目标地域来挖掘旅游路线的设备,旅游路线以景点序列的形式表示,该设备包括:旅游文章检索装置,用于检索涉及旅游目标地域的旅游文章;景点序列获得装置,用于针对各篇旅游文章,分别获得由其中包含的景点构成的景点序列;景点序列筛选装置,用于筛选包含一个或多个特定景点的景点序列,作为针对旅游目标地域的备选景点序列。优选地,该设备还可以包括:景点序列评分装置,用于根据预定序列评分规则,为每个备选景点序列设置景点序列分值,并且按景点序列分值从高到低的顺序将多个所述备选景点序列排序,以便响应于来自客户端的请求而按此顺序提供给客户端。优选地,该设备还可以包括:目标地域确定装置,用于响应于来自客户端的包含表示旅游意向的旅游特征词和表示旅游目标地域的旅游目标地域词的搜索请求,确定旅游目标地域;以及景点序列提供装...

【技术保护点】
一种基于旅游目标地域来挖掘旅游路线的方法,所述旅游路线以景点序列的形式表示,该方法包括:检索涉及所述旅游目标地域的旅游文章;针对各篇旅游文章,分别获得由其中包含的景点构成的景点序列;筛选包含一个或多个特定景点的所述景点序列,作为针对所述旅游目标地域的备选景点序列。

【技术特征摘要】
1.一种基于旅游目标地域来挖掘旅游路线的方法,所述旅游路线
以景点序列的形式表示,该方法包括:
检索涉及所述旅游目标地域的旅游文章;
针对各篇旅游文章,分别获得由其中包含的景点构成的景点序列;
筛选包含一个或多个特定景点的所述景点序列,作为针对所述旅
游目标地域的备选景点序列。
2.根据权利要求1所述的方法,还包括:
根据预定序列评分规则,为每个备选景点序列设置景点序列分值,
并且按景点序列分值从高到低的顺序将多个所述备选景点序列排序,
以便响应于来自客户端的请求而按此顺序提供给客户端。
3.根据权利要求2所述的方法,其中,所述预定序列评分规则基
于以下特征中的至少一项:
时间合理性;
是否存在重复景点;
热门景点所占比例;
冷门景点所占比例;
旅行强度;以及
线路长度。
4.根据权利要求1或2所述的方法,还包括:
响应于来自客户端的包含表示旅游意向的旅游特征词和表示旅游
目标地域的旅游目标地域词的搜索请求,确定所述旅游目标地域;以

基于所确定的旅游目标地域,向所述客户端提供所述备选景点序
列中的至少一个。
5.根据权利要求4所述的方法,还包括:
基于来自客户端的旅游条件信息、包含所述特定景点的数量以及
所述景点序列分值,计算所述备选景点序列的相关性分值,
其中,基于所述相关性分值,向所述客户端提供所述备选景点序
列中的至少一个。
6.根据权利要求1所述的方法,还包括:
滤除包含景点黑名单上的景点的景点序列。
7.根据权利要求1所述的方法,其中,所述获得景点序列的步骤
包括:
在所述旅游文章中查找与景点的游览时间相关的游览时间信息;
在没有查找到游览时间信息的情况下,根据所述旅游文章中出现
次序相邻的两个景点之间的距离和/或从第三方获取的游览时间建议,
估计与各景点对应的游览时间信息;
在查找到游览时间信息的情况下,从所述旅游文章中提取与各景
点对应的游览时间信息;以及
通过使各景点和与其对应的游览时间信息相关联来形成所述景点
序列。
8.根据权利要求1所述的方法,还包括:
根据预定景点评分规则为所述景点分别设置景点分值,并基于所
述景点分值设定所述特定景点;和/或
向客户端提供所述旅游文章中包含的至少部分景点的列表,并将
用户从所述列表中选择的景点设定为所述特定景点。
9.根据权利要求8所述的方法,其中,所述预定景点评分规则基
于以下特征中的至少一项:
景点的搜索页面浏览量;
针对景点的搜索量;
包含该景点的景点序列数量;以及
第三方对该景点的评价。
10....

【专利技术属性】
技术研发人员:李天宁
申请(专利权)人:广州神马移动信息科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1