【技术实现步骤摘要】
本专利技术涉及信息数据处理
,特别涉及一种旅游目的地中的数据语义关联分析方法及系统。
技术介绍
目前,旅游行业有很多信息服务商以及OTA,对外提供了许多景区的评论,门票信息,攻略信息等,形成了旅游方向的网络舆情,但是这些信息目前采用了诸如打标签的方式进行了数据分类。现有技术无法获得这些评论数据中内在的信息关联,从而也无法从中提取出对景区发展有指导意义的数据。
技术实现思路
有鉴于此,本专利技术提出一种旅游目的地中的数据语义关联分析方法及系统。一种旅游目的地中的数据语义关联分析方法,其包括如下步骤:S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;S3、根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;S4、根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;S5、查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;S6、查找该形容 ...
【技术保护点】
一种旅游目的地中的数据语义关联分析方法,其特征在于,其包括如下步骤:S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;S3、根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;S4、根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;S5、查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;S6、查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和 ...
【技术特征摘要】
1.一种旅游目的地中的数据语义关联分析方法,其特征在于,其包括如下步骤:S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;S3、根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;S4、根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;S5、查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;S6、查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。2.如权利要求1所述的旅游目的地中的数据语义关联分析方法,其特征在于,所述步骤S3包括:S31、返回拥有该形容词的所有评论内容列表;S32、获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;S33、如果一个名词在名词临时表中已经出现,则归并该名词,增加该名词出现次数;S34、列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。3.如权利要求1所述的旅游目的地中的数据语义关联分析方法,其特征在于,所述步骤S4包括:S41、返回拥有该名词的所有评论内容列表;S42、获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;S43、如果一个形容词在形容词临时表出现,则归并该形容词,增加该形容词的出现次数;S44、列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。4.如权利要求1所述的旅游目的地中的数据语义关联分析方法,其特征在于,所述步骤S5包括:S51、选定该名词,查找包含该名词的评论内容;S52、对每个评论内容内的所有词汇进行词性和顺序分解;S53、对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;S54、将找到的形容词放入关联形容词暂存表,重复步骤S52直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在步骤S55中进行统计排序;S55、将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。5.如权利要求1所述的旅游目的地中的数据语义关联分析方法,其特征在于,所述步骤S6包括:S61、选定该形容词,查找包含该形容词的评论内容;S62、对每个评论内容内的所有词汇进行词性和顺序分解;S63、对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;S64、将找到的名词放入关联名词暂存表,重复步骤S62直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在步骤S65中进行统计排序;S65、将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。6.一种旅游目的地中的数据语义关联分析系统,其特征在于,其包括如下单元:归类单元,用于对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归...
【专利技术属性】
技术研发人员:杜亭,田广礼,张西,陈云武,谭丽娟,
申请(专利权)人:大地风景武汉信息技术有限公司,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。