一种基于游客画像的景区推荐方法、设备及存储介质技术

技术编号:36258139 阅读:18 留言:0更新日期:2023-01-07 09:54
本申请公开了一种基于游客画像的景区推荐方法、设备及存储介质,属于智慧景区技术领域,本申请提供的一种基于游客画像的景区推荐方法,通过自动挖掘用户的在旅游平台和网站上的评论信息,挖掘用户的情感倾向,从而建立用户的情感画像,使用改进的推荐算法向用户推荐景点,对用户进行景点推荐。对用户进行景点推荐。对用户进行景点推荐。

【技术实现步骤摘要】
一种基于游客画像的景区推荐方法、设备及存储介质


[0001]本专利技术属于智慧景区
,具体来说是一种基于游客画像的景区推荐方法、设备及存储介质。

技术介绍

[0002]景区构建游客画像,主要是根据游客游前、游中的咨询以及游后的问卷反馈等信息进而抽象出的一个标签化的游客模型,构建游客画像的核心工作是即时给用户贴标签,而便签是通过对用户的信息分析而来的高度精炼的特征标志。
[0003]随着信息的迅猛发展,各类信息十分容易造成信息过载,导致人们无法高效识别有效信息,难以为自身决断提供帮助。

技术实现思路

[0004]为解决或部分解决上述技术问题,本专利技术提供一种基于游客画像的景区推荐方法、设备及存储介质,通过自动挖掘用户的在旅游平台和网站上的评论信息,挖掘用户的情感倾向,从而建立用户的情感画像,使用改进的推荐算法向用户推荐景点,对用户进行景点推荐,具体技术方案如下:一种基于游客画像的景区推荐方法,包括如下步骤:S1、数据获取:获取用户旅游评论的文本数据;S2、预处理:对获取的文本数据依次进行分词、去除停用词、词性标注和语义依存分析操作得到预处理后的文本数据;S3、句式判断:将预处理后的文本数据与特殊句式规则库进行比对,若存在一致则判定为特殊句式,执行步骤S4,若不存在一致则判定为普通句式,执行步骤S5;所述特殊句式规则库包括否定句式规则和假设句式规则;S4、评论观点提取:将预处理后的文本数据作为输入,与基础词性规则库进行比较,然后经过筛选后得到了评论观点库,对评论观点库进行宽松匹配,获取新型词性规则库,将新型词性规则库更新到基础词性规则库,再次将预处理后的文本数据与更新后的基础词性规则库比较,如此循环,直到停止获取新型词性规则库规则结束,获取评论观点数据;所述评论观点数据的句式为属性词+副词+形容词的格式;S5、特殊句式观点提取:确定特殊句式类型,若为假设句式则将预处理后的文本数据作为输入提取评论观点,并加入否定副词,若为否定句式则将预处理后的文本数据作为输入提取评论观点;S6、将提取的评论观点数据输入ASUM混合模型进行评论挖掘,得到用户的情感

主题分布,并设置情感S的取值为0和1;S7、将用户情感

主题分布使用层次化聚类算法对所有用户进行分类;S8、构建用户

评分矩阵,根据相似度公式计算用户评分相似度;
其中,sim
r
(x,y)表示用户x、y的评分相似度,表示为用户x、y的余弦相似度,表示为用户x、y的杰卡德相似系数,表示用户x、y打分的评分向量,和表示用户x、y的评分向量集合;S9、根据公式sim
s

t
(x,y)计算用户的情感

主题相似度;其中,其中,式中,和分别表示用户x、y的积极情感

主题相似度和消极情感

主题相似度,和分别表示用户x、y的积极情感

主题和消极情感

主题的余弦相似度,和分别表示用户x、y的积极情感

主题和消极情感

主题的杰卡德相似系数,分别表示用户x的积极情感

主题分布、用户y的积极情感

主题分布、用户x的消极情感

主题分布、用户y的消情感

主题分布,分别表示用户x积极情感

主题分布集合、用户y积极情感

主题分布集合、用户x消极情感

主题分布集合、用户y消极情感

主题分布集合;S10、根据综合相似度计算公式计算综合相似度;所述综合相似度计算公式如下:sim(x,y)=α
·
sim
s

t
(x,y)+(1

α)
·
sim
r
(x,y);S11、计算用户对于景点的预测得分,根据景点的预测得分进行降序排列,将排序前列的预设数量个景点推荐给用户。
[0005]第二方面,提供一种计算机设备,包括一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上述第一方面所述的方法。
[0006]第三方面,提供一种存储有计算机程序的存储介质,该程序被处理器执行时实现如上述第一方面所述的方法。
[0007]本专利技术的好处在于:1.通过自动挖掘用户的在旅游平台和网站上的评论信息,挖掘用户的情感倾向,从而建立用户的情感画像,使用改进的推荐算法向用户推荐景点,对用户进行景点推荐;2.采用词性规则和特殊句式的组合进行评论观点数据的提取,并结合ASUM主题

情感混合模型,使得推荐算法的推荐更加精准。
附图说明
[0008]图1为本专利技术一实施例提供的一种方法流程示意图。
[0009]图2为本专利技术一实施例提供的一种计算机设备的结构示意图。
具体实施方式
[0010]以下结合具体实施例和说明书附图对本专利技术做出进一步清楚详细的描述说明。本领域普通技术人员在基于这些说明的情况下将能够实现本专利技术。此外,下述说明中涉及到的本专利技术的实施例通常仅是本专利技术一部分的实施例,而不是全部的实施例。因此,基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0011]实施例:本实施例提供了一种基于游客画像的景区推荐方法,如图1所示,包括如下步骤:S1、数据获取:获取用户旅游评论的文本数据;S2、预处理:对获取的文本数据依次进行分词、去除停用词、词性标注和语义依存分析操作得到预处理后的文本数据;S3、句式判断:将预处理后的文本数据与特殊句式规则库进行比对,若存在一致则判定为特殊句式,执行步骤S4,若不存在一致则判定为普通句式,执行步骤S5;所述特殊句式规则库包括否定句式规则和假设句式规则;S4、评论观点提取:将预处理后的文本数据作为输入,与基础词性规则库进行比较,然后经过筛选后得到了评论观点库,对评论观点库进行宽松匹配,获取新型词性规则库,将新型词性规则库更新到基础词性规则库,再次将预处理后的文本数据与更新后的基础词性规则库比较,如此循环,直到停止获取新型词性规则库规则结束,获取评论观点数据;所述评论观点数据的句式为属性词+副词+形容词的格式S5、特殊句式:确定特殊句式类型,若为假设句式则将预处理后的文本数据作为输入提取评论观点,并加入否定副词,若为否定句式则将预处理后的文本数据作为输入提取评论观点;S6、将提取的评论观点数据输入ASUM混合模型进行评论挖掘,得到用户的情感

主题分布,并设置情感S的取值为0和1;S7、将用户情感

主题分布使用层次化聚类算法对所有用户进行分类;S8、构建用户

评分矩阵根据sim
r
(x,y)公式计算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于游客画像的景区推荐方法,其特征在于,包括如下步骤:S1、数据获取:获取用户旅游评论的文本数据;S2、预处理:对获取的文本数据依次进行分词、去除停用词、词性标注和语义依存分析操作得到预处理后的文本数据;S3、句式判断:将预处理后的文本数据与特殊句式规则库进行比对,若存在一致则判定为特殊句式,执行步骤S4,若不存在一致则判定为普通句式,执行步骤S5;所述特殊句式规则库包括否定句式规则和假设句式规则;S4、评论观点提取:将预处理后的文本数据作为输入,与基础词性规则库进行比较,然后经过筛选后得到了评论观点库,对评论观点库进行宽松匹配,获取新型词性规则库,将新型词性规则库更新到基础词性规则库,再次将预处理后的文本数据与更新后的基础词性规则库比较,如此循环,直到停止获取新型词性规则库规则结束,获取评论观点数据;所述评论观点数据的句式为属性词+副词+形容词的格式;S5、特殊句式观点提取:确定特殊句式类型,若为假设句式则将预处理后的文本数据作为输入提取评论观点,并加入否定副词,若为否定句式则将预处理后的文本数据作为输入提取评论观点;S6、将提取的评论观点数据输入ASUM混合模型进行评论挖掘,得到用户的情感

主题分布,并设置情感S的取值为0和1;S7、将用户情感

主题分布使用层次化聚类算法对所有用户进行分类;S8、构建用户

评分矩阵,根据sim
r
(x,y)公式计算用户评分相似度;其中,sim
r
(x,y)表示用户x、y的评分相似度,表示为用户x、y的余弦相似度,表示为用户x、y的杰卡德相似系数,表示用户x、y打分的评分向量,和表示用户x、y的评分向量集合;S9、根据公式sim
s

t
(x,y)计算用户的情感

【专利技术属性】
技术研发人员:应航陈海江张良友
申请(专利权)人:浙江力石科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1