一种旅游热点事件检测方法及系统技术方案

技术编号：16128886 阅读：32 留言：0更新日期：2017-09-01 20:53

本发明专利技术提供了一种旅游热点事件检测方法及系统，其中方法包括：预先设置旅游专业知识库，获取网络文本数据；根据所述网络文本数据聚类热点词汇；匹配所述热点词汇和所述旅游专业知识库，计算相似度；根据所述相似度设置热点词汇的权重，重新聚类，获取旅游热点事件。本方案能够使得最终的热点聚类结果更加准确。

Method and system for detecting hot spots of Tourism

The present invention provides a method and system for detecting a tourist spot, wherein the method comprises the following steps: pre setting the tourism professional knowledge base, access network text data; according to the network text data clustering, the hot focus of vocabulary; vocabulary and the tourism professional knowledge base, similarity calculation; according to the weight, the similarity set hot vocabulary clustering, to obtain the tourism hot events. This scheme can make the final hot spot clustering more accurate.

全部详细技术资料下载

【技术实现步骤摘要】
一种旅游热点事件检测方法及系统
本专利技术涉及数据检测
，尤其涉及一种旅游热点事件检测方法及系统。
技术介绍
当前国内经济形势呈上升趋势，旅游业也随之蓬勃发展，旅游行业信息成为炙手可热的商业数据。对旅游行业信息进行数据挖掘，可以为旅游从业者提供策略咨询，可以为旅游监管部门提供宏观分析，还可以对整个旅游行业做前景预测，具有非常大的市场意义。当前旅游业发展出现游客量随旅游热点事件井喷式爆发的趋势，挖掘旅游热点事件成为热门的研究课题。目前，现有的旅游热点事件检测大多数采用对网络文本数据进行文本聚类的方法，从聚类结果中提取出热点信息。然而，大多数的热点提取过程，并没有采用专业的旅游专业知识为指导，使得最终的热点聚类结果不够准确。
技术实现思路
有鉴于此，本专利技术要解决的技术问题是提供一种旅游热点事件检测方法及系统，能够使得最终的热点聚类结果更加准确。本专利技术的技术方案是这样实现的：第一方面，本专利技术实施例提供了一种旅游热点事件检测方法，包括：预先设置旅游专业知识库，还包括以下步骤：步骤1：获取网络文本数据；步骤2：根据所述网络文本数据聚类热点词汇；步骤3：匹配所述热点词汇和所述旅游专业知识库，计算相似度；步骤4：根据所述相似度设置热点词汇的权重，重新聚类，获取旅游热点事件。优选的，在所述步骤2之前，还包括：清洗所述网络文本数据。优选的，在所述清洗所述网络文本数据之后，还包括：将所述网络文本数据进行分词，生成词向量，并将所述词向量转换为数值向量。优选的，所述根据所述网络文本数据聚类热点词汇包括：根据划分聚类算法，将所述数值向量聚类出热点词汇。优选的，所述相似...
一种旅游热点事件检测方法及系统

【技术保护点】
一种旅游热点事件检测方法，其特征在于，包括：预先设置旅游专业知识库，还包括以下步骤：步骤1：获取网络文本数据；步骤2：根据所述网络文本数据聚类热点词汇；步骤3：匹配所述热点词汇和所述旅游专业知识库，计算相似度；步骤4：根据所述相似度设置热点词汇的权重，重新聚类，获取旅游热点事件。

【技术特征摘要】
1.一种旅游热点事件检测方法，其特征在于，包括：预先设置旅游专业知识库，还包括以下步骤：步骤1：获取网络文本数据；步骤2：根据所述网络文本数据聚类热点词汇；步骤3：匹配所述热点词汇和所述旅游专业知识库，计算相似度；步骤4：根据所述相似度设置热点词汇的权重，重新聚类，获取旅游热点事件。2.如权利要求1所述的旅游热点事件检测方法，其特征在于，在所述步骤2之前，还包括：清洗所述网络文本数据。3.如权利要求2所述的旅游热点事件检测方法，其特征在于，在所述清洗所述网络文本数据之后，还包括：将所述网络文本数据进行分词，生成词向量，并将所述词向量转换为数值向量。4.如权利要求3所述的旅游热点事件检测方法，其特征在于，所述根据所述网络文本数据聚类热点词汇包括：根据划分聚类算法，将所述数值向量聚类出热点词汇。5.如权利要求1-4任一项所述的旅游热点事件检测方法，其特征在于，所述相似度计算方法为：其中，same(a，b)表示集合a和b之间的共有元素数量，sum(a，b)表示集合a和b非重复元素总和。6.一种旅游热点事件检测系统，其特征在于，包括：...

【专利技术属性】
技术研发人员：李震川，庞子龙，曹磊，王子剑，陈龙，严武，
申请(专利权)人：上海诺悦智能科技有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人