【技术实现步骤摘要】
一种基于大数据的旅游目的地评价方法
本专利技术涉及大数据技术和信息提取
,具体涉及一种基于大数据的旅游目的地评价方法。
技术介绍
随着“大数据”时代的到来,人们对于海量数据的挖掘和运用,这预示着新一波生产率增长和消费者盈余浪潮的到来。旅游业作为一个信息高度密集的行业,旅游者的流动与评论在产生了大量的数据。这些数据中隐藏了大量旅游者与旅游地的重要信息。相比传统的旅游研究方法与数据获取方法,这类基于大数据的信息,一方面真实,都是源于旅游者真实的行为以及行为数据,比传统的问卷技术采样更为客观,更能反映社会真实。另一方面,这类数据更新及时,可以几乎实时有效地反映客观事实。如果能够有效地采集这类旅游者在网络上留存的大数据,可以通过游客的评论中,发现对于旅游目的地的真实实时的评价,这对于发现旅游目的地的已有优势和不足、推动旅游目的地区域的建设改进而言,具有巨大的现实价值和指导意义。
技术实现思路
针对现有技术中存在的不足,本专利技术的目的在于提供一种基于大数据的旅游目的地评价方法,用于依据大数据的采集实现对旅游目的地的综合评价,为发现旅游目的地的已有优势和不足以及推动旅游目的地区域的建设改进提供指导信息。为实现上述目的,本专利技术采用了如下技术方案:基于大数据的旅游目的地评价方法,包括如下步骤:获取互联网络中对旅游目的地的点评信息;所述点评信息包括点评人信息、点评时间信息和点评内容文本信息;对获取的旅游目的地的点评信息中的点评内容文本信息进行分词识别处理,根据所述分词识别处理结果识别出所述点评内容文本信息中所描述的旅游目的地要素属性,并利用预设的情感词典识别出所述分 ...
【技术保护点】
1.基于大数据的旅游目的地评价方法,其特征在于,包括如下步骤:获取互联网络中对旅游目的地的点评信息;所述点评信息包括点评人信息、点评时间信息和点评内容文本信息;对获取的旅游目的地的点评信息中的点评内容文本信息进行分词识别处理,根据所述分词识别处理结果识别出所述点评内容文本信息中所描述的旅游目的地要素属性,并利用预设的情感词典识别出所述分词识别处理结果中针对所述旅游目的地要素属性的情况描述状态;通过所获取的旅游目的地的各点评信息所体现的各不同点评人在不同点评时间的点评内容文本信息中识别出的各种旅游目的地要素属性及其相应的情况描述状态加以统计,根据对每种旅游目的地要素属性的出现次数的统计对相应旅游目的地要素属性进行关注重要性估分计算,根据对每种旅游目的地要素属性对应的情况描述状态的统计对相应旅游目的地要素属性进行情感评价估分计算,从而得到针对旅游目的地识别出的各种旅游目的地要素属性的关注重要性评价分值以及每种旅游目的地要素属性对应的情感评价分值,用以分别表征旅游目的地在所述各中旅游目的地要素属性上的评价情况。
【技术特征摘要】
1.基于大数据的旅游目的地评价方法,其特征在于,包括如下步骤:获取互联网络中对旅游目的地的点评信息;所述点评信息包括点评人信息、点评时间信息和点评内容文本信息;对获取的旅游目的地的点评信息中的点评内容文本信息进行分词识别处理,根据所述分词识别处理结果识别出所述点评内容文本信息中所描述的旅游目的地要素属性,并利用预设的情感词典识别出所述分词识别处理结果中针对所述旅游目的地要素属性的情况描述状态;通过所获取的旅游目的地的各点评信息所体现的各不同点评人在不同点评时间的点评内容文本信息中识别出的各种旅游目的地要素属性及其相应的情况描述状态加以统计,根据对每种旅游目的地要素属性的出现次数的统计对相应旅游目的地要素属性进行关注重要性估分计算,根据对每种旅游目的地要素属性对应的情况描述状态的统计对相应旅游目的地要素属性进行情感评价估分计算,从而得到针对旅游目的地识别出的各种旅游目的地要素属性的关注重要性评价分值以及每种旅游目的地要素属性对应的情感评价分值,用以分别表征旅游目的地在所述各中旅游目的地要素属性上的评价情况。2.根据权利要求1所述基于大数据的旅游目的地评价方法,其特征在于,所述旅游目的地的点评信息的获取方式具体为:a1)获取互联网络中抓取针对旅游目的地进行点评描述的点评人、点评时间和点评描述文字信息,并使用纯文本格式加以存储;a2)根据预设的旅游目的地无关敏感词数据库,采用敏感词识别技术对纯文本格式的点评描述文字信息进行无关敏感词识别,进而删除所述点评描述文字信息中的无关敏感词,将剩余的文字信息作为旅游目的地的点评内容文本信息;a3)将由此获得的点评人信息、点评时间信息和点评内容文本信息作为旅游目的地的点评信息。3.根据权利要求1所述基于大数据的旅游目的地评价方法,其特征在于,所述旅游目的地要素属性包括如下的任意一种或多种:资源景区、人造景区、娱乐活动、运动康体、节庆事件、餐饮美食、酒店住宿、购物商品、旅游服务、旅游价格、旅游解说、旅游设施、经济水平、环境风貌、外部交通、内部交通、游憩场所、公共服务、安全治安、地方氛围、居民态度、天气气候。4.根据权利要求1所述基于大数据的旅游目的地评价方法,其特征在于,所述旅游目的地要素属性的识别方式具体为:b1)基于对旅游目的地的点评信息中的点评内容文本信息的分词识别处理结果,根据先验知识分别判断所述分词识别处理结果中划分出的每个词语是否为对旅游目的地的评论描述词语,进而提取出其中的各个评论描述词语;b2)利用人工分类的方式或机器学习的分类方式,分别对提取出的各个评论描述词语进行旅游目的地要素属性类别的归类,使得归类所得的每一个旅游目的地要素属性类别中的评论描述词语都是在描述旅游目的同一个要素属性;b3)分别统计归类所得的各个旅游目的地要素属性类别中评论描述词语的出现频次,将出现频次由高到低排...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。