本发明专利技术公开了一种基于大数据分析的旅游景点推荐方法及装置,涉及互联网技术领域,方法包括:获取有关旅游景点的舆情信息,对舆情信息进行分类和分析,建立旅游景点的网络关注度数据库;获取往期各个旅游景点的名称及游客量、以及旅游网站上各个旅游景点的订购数量,使用各个旅游景点的往期游客量、以及当前的订购数量对网络关注度数据库中的数据进行修正,得到综合关注度数据库;获取用户关注的旅游景点类型;根据用户关注的旅游景点类型在综合关注度数据库中筛选符合条件的旅游景点,将筛选出的旅游景点推荐给用户。本发明专利技术在传统预测方法基础上,结合对互联网舆情分析,得到更加能够反映真实关注度的信息,提高了推荐的准确性和合理性。
【技术实现步骤摘要】
一种基于大数据分析的旅游景点推荐方法及装置
本专利技术涉及互联网
,特别是涉及一种基于大数据分析的旅游景点推荐方法及装置。
技术介绍
旅游是目前人们放松身心的首选休闲形式,旅游行为大多发生在节假日,但是由于大多数人的工作时间都是与国家规定的时间一致,导致节假日旅游人数井喷式爆发,大大降低了游客的体验,因此很多人现在都愿意选择错峰出行,以在游客人数少的时候得到完整的旅游体验。为了规避旅游高峰的影响,很多人都会选在非节假日出游。但仅仅这样也并不能保证景点不会存在大量的游客,因此出现了根据一些客观因素进行客流量预测的方法。这些客流量预测方法大多数都是根据往期同时段的流量进行预测,虽然也具有一定的参考意义,但是不符合当前旅游的新形势。目前,很多旅游景点都在打造“网红”现象,即通过互联网大力宣传景点的形象,使得作为旅游主体的年轻人大大增加对景点的兴趣,导致短时间内景点的游客大量增加。景点的宣传行为可能发生在任何时间,和节假日并不存在很紧密的联系,因此传统的预测方法对景点客流量的预测准确性不适应目前高速发展的社会。
技术实现思路
本专利技术实施例提供了一种基于大数据分析的旅游景点推荐方法及装置,可以解决现有技术中存在的问题。本专利技术提供了一种基于大数据分析的旅游景点推荐方法,包括以下步骤:获取互联网上有关旅游景点的舆情信息,对所述舆情信息进行分类和分析,建立旅游景点的网络关注度数据库;获取往期各个旅游景点的名称及游客量、以及旅游网站上各个旅游景点的订购数量,使用各个旅游景点的往期游客量、以及当前的订购数量对所述网络关注度数据库中的数据进行修正,得到综合关注度数据库;获取用户关注的旅游景点类型;根据用户关注的旅游景点类型在所述综合关注度数据库中筛选符合条件的旅游景点,将筛选出的旅游景点推荐给用户。本专利技术还提供了一种基于大数据分析的旅游景点推荐装置,所述装置包括:网络服务器,用于获取互联网上有关旅游景点的舆情信息,对所述舆情信息进行分类和分析,建立旅游景点的网络关注度数据库;所述网络服务器还用于,获取往期各个旅游景点的名称及游客量、以及旅游网站上各个旅游景点的订购数量,使用各个旅游景点的往期游客量、以及当前的订购数量对所述网络关注度数据库中的数据进行修正,得到综合关注度数据库;移动终端,用于获取用户关注的旅游景点类型,根据用户关注的旅游景点类型在所述综合关注度数据库中筛选符合条件的旅游景点,将筛选出的旅游景点推荐给用户。本专利技术中的一种基于大数据分析的旅游景点推荐方法及装置,方法包括:获取有关旅游景点的舆情信息,对舆情信息进行分类和分析,建立旅游景点的网络关注度数据库;获取往期各个旅游景点的名称及游客量、以及旅游网站上各个旅游景点的订购数量,使用各个旅游景点的往期游客量、以及当前的订购数量对网络关注度数据库中的数据进行修正,得到综合关注度数据库;获取用户关注的旅游景点类型;根据用户关注的旅游景点类型在综合关注度数据库中筛选符合条件的旅游景点,将筛选出的旅游景点推荐给用户。本专利技术在传统预测方法基础上,结合对互联网舆情分析,得到更加能够反映真实关注度的信息,提高了推荐的准确性和合理性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的一种基于大数据分析的旅游景点推荐方法的流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参照图1,本专利技术提供了一种基于大数据分析的旅游景点推荐方法,该方法主要包括以下步骤:获取互联网上有关旅游景点的舆情信息,对所述舆情信息进行分类和分析,建立旅游景点的网络关注度数据库;获取往期各个旅游景点的名称及游客量、以及旅游网站上各个旅游景点的订购数量,使用各个旅游景点的往期游客量、以及当前的订购数量对所述网络关注度数据库中的数据进行修正,得到综合关注度数据库;获取用户关注的旅游景点类型;根据用户关注的旅游景点类型在所述综合关注度数据库中筛选符合条件的旅游景点,将筛选出的旅游景点推荐给用户。在上述步骤中,获取所述舆情信息的方式包括从各种网络平台的数据库中爬取一段时间内的所有信息,然后从爬取的信息中通过关键词筛选的方式得到其中有关旅游景点的信息。由于微博、微信、自媒体等网络平台在年轻人中使用非常广泛,而这些受众又是旅游行为的主要参与人,因此获取网络平台上有关旅游景点的关注度,能够为旅游景点客流量预测提供真实的数据参考。得到的舆情信息中包括与各个旅游景点相关的所有信息,这些信息往往是杂乱无章的,需要对其进行分类和分析。在分类过程中,使用关键词提取的方式为舆情信息中的每一条信息制定主标签,然后将具有相同主标签的舆情信息归为同一个类别。本专利技术的实施例中,主标签是旅游景点的名称。在分析过程中,分别对每一类的舆情信息进行单独分析,对每一类舆情信息的分析方法均相同。具体分析时,将舆情信息中的发起主体、发起内容和参与内容的信息分别提取出来,然后采用情感词分析的方法分析发起内容的情感倾向,即是否为推荐旅游景点的倾向。接着分析该发起内容下所有参与内容的情感倾向,将与发起内容具有相同情感倾向的参与内容的数量进行统计,作为该舆情信息的第一子标签。然后,分析发起主体的被关注量以及该条发起内容的被转发量,将该两个数据进行综合计算,得到该舆情信息的第二子标签。最后,将所述第一子标签和第二子标签进行综合计算,得到该舆情信息的子标签。将该子标签和主标签进行组合,得到旅游景点的综合标签。例如,某个微博用户具有50万的关注用户,其发布一条推荐北京故宫的博文后,得到了8000人的回复,其中5000人表达了明确的、喜欢北京故宫的感情,而且该条博文得到了10000的转发量。则该条舆情信息的主标签就是北京故宫,第一子标签为参与量5000,第二子标签为综合量500000/10000*10000=500000,最终得到的子标签为关注量500000/10000*5000=250000。对主标签和子标签组合后,得到的综合标签是北京故宫关注量250000。将上述得到的综合标签进行统一存储,得到所述网络关注度数据库。由于所述网络关注度数据库中同一类别的舆情信息存在很多重复的数据,例如,同一个用户发起关于同一个旅游景点的多条博文,或同一个用户参与了多条关于同一个旅游景点的博文评论,因此对于网络关注度数据库中的综合标签需要进行去重处理,去重处理的原则是对于同一个旅游景点仅保留同一个用户的一次发起或一次本文档来自技高网...
【技术保护点】
1.一种基于大数据分析的旅游景点推荐方法,其特征在于,包括以下步骤:/n获取互联网上有关旅游景点的舆情信息,对所述舆情信息进行分类和分析,建立旅游景点的网络关注度数据库;/n获取往期各个旅游景点的名称及游客量、以及旅游网站上各个旅游景点的订购数量,使用各个旅游景点的往期游客量、以及当前的订购数量对所述网络关注度数据库中的数据进行修正,得到综合关注度数据库;/n获取用户关注的旅游景点类型;/n根据用户关注的旅游景点类型在所述综合关注度数据库中筛选符合条件的旅游景点,将筛选出的旅游景点推荐给用户。/n
【技术特征摘要】
1.一种基于大数据分析的旅游景点推荐方法,其特征在于,包括以下步骤:
获取互联网上有关旅游景点的舆情信息,对所述舆情信息进行分类和分析,建立旅游景点的网络关注度数据库;
获取往期各个旅游景点的名称及游客量、以及旅游网站上各个旅游景点的订购数量,使用各个旅游景点的往期游客量、以及当前的订购数量对所述网络关注度数据库中的数据进行修正,得到综合关注度数据库;
获取用户关注的旅游景点类型;
根据用户关注的旅游景点类型在所述综合关注度数据库中筛选符合条件的旅游景点,将筛选出的旅游景点推荐给用户。
2.如权利要求1所述的一种基于大数据分析的旅游景点推荐方法,其特征在于,获取互联网上有关旅游景点的舆情信息具体为:
从各种网络平台的数据库中爬取一段时间内的所有信息,然后从爬取的信息中通过关键词筛选的方式得到其中有关旅游景点的舆情信息。
3.如权利要求1所述的一种基于大数据分析的旅游景点推荐方法,其特征在于,对所述舆情信息进行分类时,使用关键词提取的方式为每一条舆情信息制定主标签,然后将具有相同主标签的舆情信息归为同一个类别。
4.如权利要求3所述的一种基于大数据分析的旅游景点推荐方法,其特征在于,对同一个类别的舆情信息进行分析时,将舆情信息中的发起主体、发起内容和参与内容的信息分别提取出来;
采用情感词分析的方法分析发起内容的情感倾向,以及该发起内容下所有参与内容的情感倾向,将与发起内容具有相同情感倾向的参与内容的数量进行统计,作为该舆情信息的第一子标签;
分析发起主体的被关注量以及该条发起内容的被转发量,将该两个数据进行综合计算,得到该舆情信息的第二子标签;
将所述第一子标签和第二子标签进行综合计算,得到该舆情信息的子标签;
将该子标签和主标签进行组合,得到旅游景点的...
【专利技术属性】
技术研发人员:肖燕,
申请(专利权)人:宝鸡文理学院,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。