一种基于用户情感和时间动态的旅游目的地推荐方法技术

技术编号:19216045 阅读:55 留言:0更新日期:2018-10-20 06:50
本发明专利技术揭示了一种基于用户情感和时间动态的旅游目的地推荐方法,包括以下步骤:首先使用意见挖掘技术来获得用户的情感倾向的定量值,将情感程度融入矩阵分解模型中,并随着时间的变化采用时间动态机制来表示用户偏好和旅游目的地受欢迎程度。然后结合用户情感和时间影响这两种元素与SVD++方法融合,构建成合成推荐模型。通过分析其显性或隐性反馈,自动学习用户的偏好,使旅游休闲资源的特征与用户需求相匹配。与几种有名的推荐方法相比,本发明专利技术提出的方法提高了推荐准确率和质量,并在公开可用的数据集上进行了一系列实验评估,表明所提出的推荐系统是优于现有的推荐系统。

【技术实现步骤摘要】
一种基于用户情感和时间动态的旅游目的地推荐方法
本专利技术涉及旅游推荐领域,尤其涉及一种基于旅游目的地推荐系统。
技术介绍
在过去十年中,互联网上可用的信息量和用户数量大大增加,对于计划访问不知名的旅游目的地并且必须安排旅行计划的用户来讲,这些信息会特别有价值。然而,搜索引擎提供的旅游目的地信息的可能性列表时是压倒性的。用户需要花费大量的时间和精力评估收集到的信息,并花费更多的时间来提取有用的信息。推荐系统可以帮助用户应对信息过载,并向他们提供个性化的推荐、内容和服务。在旅游领域,旅游推荐系统通过分析其显性或隐性反馈,自动学习用户的喜好,使旅游休闲资源的特点与用户需求相匹配。事实上,旅游目的地的推荐比其他旅游目的地更为复杂,因为用户对旅游目的地的评价数量很少,数据更加稀疏,因此,综合概况不容易建立。而且旅游目的地推荐易受到季节、交通、成本等因素的影响,因此很难构建出一个综合了许多有价值的因素的旅游目的地的推荐模型。
技术实现思路
本专利技术所要解决的技术问题是实现一种能够基于用户情感和时间动态的旅游目的地推荐系统,提出了一个时间和空间的动态模型,嵌入推荐系统中提高推荐准确性。为了实现上述目的,本专利技术采用的技术方案为:一种基于用户情感和时间动态的旅游目的地推荐方法:S1、提出基于用户情感和时间动态的旅游目的地推荐系统,依据数据集分析影响因素S2、使用Dirichlet概率分布来量化用户情感倾向程度,同时将情感倾向的量化值整合到SVD++方法中。通过对文本评论的分析,可以得到用户—目的地情感倾向矩阵。S3、通过两种时间效应,将时间动态机制包含在推荐系统中,这样项目的偏差就会被添加到时间动态中,尝试用不同的时间尺度来捕捉旅游目的地偏差。S4、约束用户情感特征向量,并从情感倾向矩阵中分解出旅游目的地极性特征向量,并统一在同一个推荐模型中被使用。整合用户情感和时间动态融合到SVD++模型中,合成矩阵分解推荐模型。S5、对目标函数采用随机梯度下降算法,从情感倾向矩阵中训练和学习用户和项目潜在因子,缓解冷启动问题。所述S2中,对文本评论的分析使用Dirichlet概率分布来量化用户情感倾向程度,同时将情感倾向的量化值整合到SVD++方法中。所述S2包括以下步骤:S21、将文本评论分为几个条款;S22、识别给出正面或负面意见的条款;S23、计算情感倾向的用户关于旅游目的地。所述Dirichlet概率分布定义如下:计算文本极性公式如下:其中,p、r和α并且分别表示概率变量、极性观测变量和先验基础速率变量,W表示非信息性先验权重,r(Li)表示具有第i个子句极性的k个可能结果的观察值序列,α(Li)代表第i个子句极性的结果满足α(Li)>0和先验概率;定义用户对旅游目的地的情感倾向为:所述S3将项目的偏差添加到时间动态中,并采用不同的时间尺度来捕捉旅游目的地偏差。所述S4中时间动态模型中预测公式如下:所述情感倾向模型中预测公式如下:其μ中表示整体平均评分,参数bu和bi分别表示观察到的用户u和项目i与平均值的偏差,Iu表示用户u评价的项目集合,yj表示用户u关于项目j的隐式反馈。所述S5中目标函数获得方式如下:所述S5采用加权正则化处理方法,目标函数公式如下:其中,正则化参数,λ,λs,用户特殊向量pu、项目特殊向量qi、用户情感特殊向量θu和旅游目的地极性特殊向量zi,Ui表示用户集里评价过项目i的用户。本专利技术旅游目的地推荐方法提高了推荐准确率和质量,并在公开可用的数据集上进行了一系列实验评估,表明所提出的推荐系统是优于现有的推荐系统。附图说明下面对本专利技术说明书中每幅附图表达的内容作简要说明:图1为基于用户情感和时间动态的旅游目的地推荐方法流程图;图2情感分析过程图;图3(a)为查看目标等级的编号图;图3(b)为特征词分布图;图4(a)按日期分的旅游人数图;图4(b)按月份的平均评分图;具体实施方式本专利技术是一种基于用户情感和时间动态的旅游目的地推荐方法,提出了一个时间和空间的动态模型,嵌入推荐系统中提高推荐准确性。旅游目的地推荐方法应用在旅游目的地推荐系统中,如含有相关软件的PC机或互联网云端,如图1所示,该方法包括如下步骤:图1为本专利技术实施例,提供一种基于用户情感和时间动态的旅游目的地推荐系统的流程图,该方法包括如下步骤:S1、提出基于用户情感和时间动态的旅游目的地推荐系统,依据数据集分析影响因素;本专利技术研究中使用的数据集是从中国著名的旅游社交网络同程提取的。本文从2012年1月到2014年12月期间从312,896位用户获得了与5,722个旅游目的地相关的985,683条评论。评论包含结构化元数据,包括星级评分(从1到5),日期、文字评论和旅游类别,清楚地表明了旅游资料的稀疏性。图3(a)和图3(b)给出了这六个主要因素的特征词的分布。这六个方面的特征词总数占70.1%,特别是风景数量,是用户最关心的话题。通过数据分析,发现用户在文本评论和星级评分中的情感强烈正相关。因此,对用户情感的更好的解释范围赋予了本文在旅游目的地推荐系统中融合文本评论的动机。第二组调查结果显示,游客人数是周期性的,长期来看也是逐渐增加的。而且,平均评级随时间波动。本文按月计算了游客人数,如图4(a)所示。如图4(b)所示。由于旅游目的地受季节影响,游客的经历也会发生变化。统计结果清楚地表明,发现游客的高峰数量与中国的假期有关。因此,想提出一个假设,即来自用户的关于旅游目的地的评论是与时间敏感相关的。基于上述两个发现,将文本评论和时间因素整合到旅游目的地推荐模型中。S2、使用Dirichlet概率分布来量化用户情感倾向程度,同时将情感倾向的量化值整合到SVD++方法中。通过对文本评论的分析,可以得到用户—目的地情感倾向矩阵模型。从文本评论中挖掘知识对于旅游建议尤为重要。使用意见挖掘技术来计算与旅游目的地相关的用户情感的值,而不仅仅分析文本评论的主题。意见挖掘算法的主要动机是量化用户对旅游目的地的情感倾向。在这个过程的最后,可以从文本评论数据集中获得一个用户目标情感矩阵。如图2所示,给出一组用户文本评论,可以分成以下步骤:S21、将文本评论分为几个条款;S22、识别给出正面或负面意见的条款;S23、计算情感倾向的用户关于旅游目的地。使用Dirichlet概率分布来量化用户情感倾向程度,Dirichlet分布表示为其中,p、r和α并且分别表示概率变量、极性观测变量和先验基础速率变量。W表示非信息性先验权重,r(Li)表示具有第i个子句极性的k个可能结果的观察值序列,α(Li)代表第i个子句极性的结果满足α(Li)>0和先验概率。从公式(2)计算出文本的极性,所使用概率期望如下:文本极性根据计算公式(3)计算的是一个带有分量的向量。本文需要将矢量转换为点值。定义用户对旅游目的地的情感倾向的价值为:在公式(4)中,s的值分布在[0,1]的范围内。根据前面提到的第二个发现,本文的情感模型建立在Koren提出的被称为SVD++模型的最先进的模型的基础之上[8]。SVD++背后的想法是考虑用户和项目的偏见和评价项目的隐含影响,除了用户和项目特定的向量对评级预测。形式上,来自用户的项目的评分由以下等式预测:其μ中表示整体平均评分,参数bu和bi分别表示观察本文档来自技高网...

【技术保护点】
1.一种基于用户情感和时间动态的旅游目的地推荐方法,其特征在于:S1、旅游目的地推荐系统获取用户评论数据集;S2、通过评论数据集的分析,得到用户的旅游目的地情感倾向矩阵;S3、将时间动态机制包含在旅游目的地推荐系统中;S4、从用户情感特征矩阵中分解出旅游目的地极性特征向量,整合情感倾向模型和时间动态模型,合成矩阵分解推荐模型。

【技术特征摘要】
1.一种基于用户情感和时间动态的旅游目的地推荐方法,其特征在于:S1、旅游目的地推荐系统获取用户评论数据集;S2、通过评论数据集的分析,得到用户的旅游目的地情感倾向矩阵;S3、将时间动态机制包含在旅游目的地推荐系统中;S4、从用户情感特征矩阵中分解出旅游目的地极性特征向量,整合情感倾向模型和时间动态模型,合成矩阵分解推荐模型。2.根据权利要求1所述的基于用户情感和时间动态的旅游目的地推荐方法,其特征在于:还包括S5、对目标函数采用随机梯度下降算法,从情感倾向矩阵中训练和学习用户和项目潜在因子特征向量,缓解冷启动问题。3.根据权利要求1或2所述的基于用户情感和时间动态的旅游目的地推荐方法,其特征在于:所述S2中,对文本评论的分析使用Dirichlet概率分布来量化用户情感倾向程度,同时将情感倾向的量化值整合到SVD++方法中。4.根据权利要求3所述的基于用户情感和时间动态的旅游目的地推荐方法,其特征在于:所述S2包括以下步骤:S21、将文本评论分为几个条款;S22、识别给出正面或负面意见的条款;S23、计算用户关于旅游目的地情感倾向。5.根据权利要求4所述的基于用户情感和时间动态的旅游目的地推荐方法,其特征在于:所述Dirichlet概率分布定义如下:计算文本极性公式如下:其中,p、r和α并...

【专利技术属性】
技术研发人员:郑孝遥徐致云胡朝焱汪祥舜孙丽萍胡桂银罗永龙
申请(专利权)人:安徽师范大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1