【技术实现步骤摘要】
本专利技术涉及互联网领域,特别涉及基于旅游目标地域来挖掘旅游路线的方法和设备。
技术介绍
人们对于旅游的需求已经不能满足于跟随旅行团的出游。与跟团游的诸多限制相比,人们更加喜欢自己设计旅行路线,然后自由出行。一些旅游网站采集了大量旅游景点的信息,并且自行设计了一些旅游路线。用户可以在网站上输入一些条件,例如希望旅游的景点、出游时间等,然后在网站的协助下,设计旅游路线。但是,一方面,这些旅游景点信息的收集和整理以及旅游路线的预先设计需要大量人工;另一方面,这里人为设定的一些参数(例如景点热门程度、推荐指数等)是基于工作人员的经验和感受设置的,有可能偏离实际游客的经验和感受。因此,人们会更多的通过搜索引擎来搜索前人在网上提供的旅游信息,例如游记、旅游攻略等,当然也包括旅游网站上提供的相关信息(可以统称为“旅游文章”)。人们期望通过浏览所检索到的相关网页或文章来确定自己的旅游路线。事实上,在搜索引擎中,用户对于旅游的搜索需求也的确占据了一个很大的比例。然而,在这个信息爆炸的时代,即便是通过使用搜索引擎,所能得到的旅游文章也很繁杂。用户需要大量的阅读和再加工,才能确定旅游路线。这将是费时费力的。从搜索查寻(Query)分析看,有的用户是针对某个景点的旅游需求,例如:用户搜索“西湖旅游”;有的用户是针对某个城市的旅游需求,例如:用户搜索“杭州旅游”。这一类可以算用户对于要游玩的目的(
【技术保护点】
一种基于旅游目标地域来挖掘旅游路线的方法,所述旅游路线以景点序列的形式表示,该方法包括:检索涉及所述旅游目标地域的旅游文章;针对各篇旅游文章,分别获得由其中包含的景点构成的景点序列;筛选包含一个或多个特定景点的所述景点序列,作为针对所述旅游目标地域的备选景点序列。
【技术特征摘要】
1.一种基于旅游目标地域来挖掘旅游路线的方法,所述旅游路线
以景点序列的形式表示,该方法包括:
检索涉及所述旅游目标地域的旅游文章;
针对各篇旅游文章,分别获得由其中包含的景点构成的景点序列;
筛选包含一个或多个特定景点的所述景点序列,作为针对所述旅
游目标地域的备选景点序列。
2.根据权利要求1所述的方法,还包括:
根据预定序列评分规则,为每个备选景点序列设置景点序列分值,
并且按景点序列分值从高到低的顺序将多个所述备选景点序列排序,
以便响应于来自客户端的请求而按此顺序提供给客户端。
3.根据权利要求2所述的方法,其中,所述预定序列评分规则基
于以下特征中的至少一项:
时间合理性;
是否存在重复景点;
热门景点所占比例;
冷门景点所占比例;
旅行强度;以及
线路长度。
4.根据权利要求1或2所述的方法,还包括:
响应于来自客户端的包含表示旅游意向的旅游特征词和表示旅游
目标地域的旅游目标地域词的搜索请求,确定所述旅游目标地域;以
及
基于所确定的旅游目标地域,向所述客户端提供所述备选景点序
列中的至少一个。
5.根据权利要求4所述的方法,还包括:
基于来自客户端的旅游条件信息、包含所述特定景点的数量以及
所述景点序列分值,计算所述备选景点序列的相关性分值,
其中,基于所述相关性分值,向所述客户端提供所述备选景点序
列中的至少一个。
6.根据权利要求1所述的方法,还包括:
滤除包含景点黑名单上的景点的景点序列。
7.根据权利要求1所述的方法,其中,所述获得景点序列的步骤
包括:
在所述旅游文章中查找与景点的游览时间相关的游览时间信息;
在没有查找到游览时间信息的情况下,根据所述旅游文章中出现
次序相邻的两个景点之间的距离和/或从第三方获取的游览时间建议,
估计与各景点对应的游览时间信息;
在查找到游览时间信息的情况下,从所述旅游文章中提取与各景
点对应的游览时间信息;以及
通过使各景点和与其对应的游览时间信息相关联来形成所述景点
序列。
8.根据权利要求1所述的方法,还包括:
根据预定景点评分规则为所述景点分别设置景点分值,并基于所
述景点分值设定所述特定景点;和/或
向客户端提供所述旅游文章中包含的至少部分景点的列表,并将
用户从所述列表中选择的景点设定为所述特定景点。
9.根据权利要求8所述的方法,其中,所述预定景点评分规则基
于以下特征中的至少一项:
景点的搜索页面浏览量;
针对景点的搜索量;
包含该景点的景点序列数量;以及
第三方对该景点的评价。
10....
【专利技术属性】
技术研发人员:李天宁,
申请(专利权)人:广州神马移动信息科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。