旅游目的地中的数据语义关联分析方法及系统技术方案

技术编号:14662681 阅读:76 留言:0更新日期:2017-02-17 09:57
一种旅游目的地中的数据语义关联分析方法,包括:S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;并进行相应的显示。

【技术实现步骤摘要】

本专利技术涉及信息数据处理
,特别涉及一种旅游目的地中的数据语义关联分析方法及系统
技术介绍
目前,旅游行业有很多信息服务商以及OTA,对外提供了许多景区的评论,门票信息,攻略信息等,形成了旅游方向的网络舆情,但是这些信息目前采用了诸如打标签的方式进行了数据分类。现有技术无法获得这些评论数据中内在的信息关联,从而也无法从中提取出对景区发展有指导意义的数据。
技术实现思路
有鉴于此,本专利技术提出一种旅游目的地中的数据语义关联分析方法及系统。一种旅游目的地中的数据语义关联分析方法,其包括如下步骤:S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;S3、根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;S4、根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;S5、查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;S6、查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。在本专利技术所述的旅游目的地中的数据语义关联分析方法中,所述步骤S3包括:S31、返回拥有该形容词的所有评论内容列表;S32、获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;S33、如果一个名词在名词临时表中已经出现,则归并该名词,增加该名词出现次数;S34、列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。在本专利技术所述的旅游目的地中的数据语义关联分析方法中,所述步骤S4包括:S41、返回拥有该名词的所有评论内容列表;S42、获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;S43、如果一个形容词在形容词临时表出现,则归并该形容词,增加该形容词的出现次数;S44、列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。在本专利技术所述的旅游目的地中的数据语义关联分析方法中,所述步骤S5包括:S51、选定该名词,查找包含该名词的评论内容;S52、对每个评论内容内的所有词汇进行词性和顺序分解;S53、对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;S54、将找到的形容词放入关联形容词暂存表,重复步骤S52直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在步骤S55中进行统计排序;S55、将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。在本专利技术所述的旅游目的地中的数据语义关联分析方法中,所述步骤S6包括:S61、选定该形容词,查找包含该形容词的评论内容;S62、对每个评论内容内的所有词汇进行词性和顺序分解;S63、对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;S64、将找到的名词放入关联名词暂存表,重复步骤S62直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在步骤S65中进行统计排序;S65、将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。本专利技术还提供一种旅游目的地中的数据语义关联分析系统,其包括如下单元:归类单元,用于对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;统计分析跳转单元,用于建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到第一处理单元,在为名词时跳转到第二处理单元,在为与名词相关的形容词时,跳转到第三处理单元,在为与形容词相关的名词时,跳转到第四处理单元;第一处理单元,用于根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;第二处理单元,用于根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;第三处理单元,用于查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;第四处理单元,用于查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。在本专利技术所述的旅游目的地中的数据语义关联分析系统中,所述第一处理单元包括:第一返回子单元,用于返回拥有该形容词的所有评论内容列表;第一记录统计子单元,用于获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;第一归并子单元,用于在一个名词在名词临时表中已经出现时,则归并该名词,增加该名词出现次数;第一显示子单元,用于列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。在本专利技术所述的旅游目的地中的数据语义关联分析系统中,所述第二处理单元包括:第二返回子单元,用于返回拥有该名词的所有评论内容列表;第二记录统计子单元,用于获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;第二归并子单元,用于在如果一个形容词在形容词临时表出现时,则归并该形容词,增加该形容词的出现次数;第二显示子单元,用于列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。在本专利技术所述的旅游目的地中的数据语义关联分析系统中,所述第三处理单元包括:第一查找子单元,用于选定该名词,查找包含该名词的评论内容;第一分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;第一排序子单元,用于对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;第一重复子单元,用于将找到的形容词放入关联形容词暂存表,重复第一分解子单元直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在第三显示子单元中进行统计排序;第三显示子单元,用于将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。在本专利技术所述的旅游目的地中的数据语义关联分析系统中,所述第四处理单元包括本文档来自技高网...
旅游目的地中的数据语义关联分析方法及系统

【技术保护点】
一种旅游目的地中的数据语义关联分析方法,其特征在于,其包括如下步骤:S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;S3、根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;S4、根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;S5、查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;S6、查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。...

【技术特征摘要】
1.一种旅游目的地中的数据语义关联分析方法,其特征在于,其包括如下步骤:S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;S3、根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;S4、根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;S5、查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;S6、查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。2.如权利要求1所述的旅游目的地中的数据语义关联分析方法,其特征在于,所述步骤S3包括:S31、返回拥有该形容词的所有评论内容列表;S32、获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;S33、如果一个名词在名词临时表中已经出现,则归并该名词,增加该名词出现次数;S34、列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。3.如权利要求1所述的旅游目的地中的数据语义关联分析方法,其特征在于,所述步骤S4包括:S41、返回拥有该名词的所有评论内容列表;S42、获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;S43、如果一个形容词在形容词临时表出现,则归并该形容词,增加该形容词的出现次数;S44、列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。4.如权利要求1所述的旅游目的地中的数据语义关联分析方法,其特征在于,所述步骤S5包括:S51、选定该名词,查找包含该名词的评论内容;S52、对每个评论内容内的所有词汇进行词性和顺序分解;S53、对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;S54、将找到的形容词放入关联形容词暂存表,重复步骤S52直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在步骤S55中进行统计排序;S55、将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。5.如权利要求1所述的旅游目的地中的数据语义关联分析方法,其特征在于,所述步骤S6包括:S61、选定该形容词,查找包含该形容词的评论内容;S62、对每个评论内容内的所有词汇进行词性和顺序分解;S63、对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;S64、将找到的名词放入关联名词暂存表,重复步骤S62直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在步骤S65中进行统计排序;S65、将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。6.一种旅游目的地中的数据语义关联分析系统,其特征在于,其包括如下单元:归类单元,用于对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归...

【专利技术属性】
技术研发人员:杜亭田广礼张西陈云武谭丽娟
申请(专利权)人:大地风景武汉信息技术有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1