基于多模态异质信息的个性化推荐方法技术

技术编号：22167086 阅读：23 留言：0更新日期：2019-09-21 10:39

本发明专利技术公开了一种基于多模态异质信息的个性化推荐方法。主要解决现有技术推荐准确率低的问题。其方案为：采集用户旅游历史记录及景点的多模态异质信息；构建景点多模态特征集，并滤除噪声景点及用户信息；将用户访问记录按时间作为划分为训练集和测试集；利用景点多模态特征集中的不同特征分别结合用户的交互记录利用隐语义模型及神经网络构建个性化推荐模型来预测用户对景点的偏好；对个性化推荐模型进行优化得到优化好的推荐模型；利用优化好的推荐模型得到用户对测试目的地中所有景点的偏好分数，将评分最大的几个景点推荐给用户。本发明专利技术通过考虑景点的多模态特征可从不同视角挖掘用户偏好，能更有效的推断用户的旅行偏好，提高了推荐准确率。

Personalized recommendation method based on multi-modal heterogeneous information

全部详细技术资料下载

【技术实现步骤摘要】
基于多模态异质信息的个性化推荐方法
本专利技术属于计算机数据处理
，更进一步涉及一种个性化推荐方法，可用于旅游景点的推荐。
技术介绍
近年来旅游业发展迅速，越来越多的人在旅游网站上分享自己的旅程导致信息量呈指数爆炸。个性化的旅游推荐能帮助人们从庞大的旅游信息中发现自己感兴趣的地点有效的解决信息过载的问题。向用户提供更智能的旅行建议，已经成为学术界和工业界的一个热门课题。现有旅游推荐方法，主要分为协同过滤方法和基于内容的推荐方法。但是有限的用户旅游记录导致用户-景点矩阵十分稀疏，而协同过滤的方法当交互数据稀疏时预测准确率会严重下降。基于内容的推荐算法利用各种的辅助信息可以缓解数据稀疏问题。但现有的一些方法仅挖掘文本信息及旅游记录景点推荐，然而这些方法仅利用单模态的文本信息，忽略了其他模态的信息，例如景点外貌特征等。研究表明多模态的异质信息对提供个性化推荐极为重要。不同的异质反馈信息从不同方面放映了用户偏好，例如：数值评分表示用户对产品的整体态度；文本评论能够表达用户对各种产品特性的意见；而产品图像则揭示了用户对产品不同视觉的偏好。然而，这些多模态信息的异质性使得它们很难以统一的方式在推荐算法中发挥作用，难以充分利用多模态信息成为限制个性化旅游推荐准确性的一个直接问题。实际上，人们的旅游决策过程可能受地域风格和景点的地域流行度的影响，用户在不同的目的地会表达出不同的兴趣。此外，景点图像的视觉吸引力也是旅游中一个重要的影响因素，不同的用户会有不同的美学偏好，而这些因素在旅游推荐算法中常被忽视。因而现有方法存在两方面的缺点：一是不能同时考虑用户在不同地域下的...

【技术保护点】
1.一种基于多模态异质信息的个性化推荐方法，包括如下步骤：(1)采集用户访问记录信息及景点的多模态异质信息，并存储至数据库，该多模态信息包括景点的评分，图像和评论；(2)根据采集的多模态异质景点信息生成景点的多模态特征集，并根据用户的访问记录时间将每个用户的最新旅游目的地的旅游记录作为测试数据，剩下的历史旅游记录和景点的多模态特征集作为训练数据；该多模态特征集包括景点的评分特征X，景点图像特征MP、文本评论特征TC及景点区域流行度特征C；(3)利用隐语义模型及神经网络构建个性化推荐模型Y，输入训练数据，采用贝叶斯个性化成对排序优化方法及端到端随机梯度下降算法来优化模型Y得到优化后的模型Y*；

【技术特征摘要】
1.一种基于多模态异质信息的个性化推荐方法，包括如下步骤：(1)采集用户访问记录信息及景点的多模态异质信息，并存储至数据库，该多模态信息包括景点的评分，图像和评论；(2)根据采集的多模态异质景点信息生成景点的多模态特征集，并根据用户的访问记录时间将每个用户的最新旅游目的地的旅游记录作为测试数据，剩下的历史旅游记录和景点的多模态特征集作为训练数据；该多模态特征集包括景点的评分特征X，景点图像特征MP、文本评论特征TC及景点区域流行度特征C；(3)利用隐语义模型及神经网络构建个性化推荐模型Y，输入训练数据，采用贝叶斯个性化成对排序优化方法及端到端随机梯度下降算法来优化模型Y得到优化后的模型Y*；其中k∈B,B＝{s,t,p,l}，其中s代表评分特征视图，t代表评论特征视图，p代表图像特征视图，l代表地域流行度特征视图；v∈V分别表示景点id，V表示数据集中所有景点的集合，u∈U表示用户id，U表示数据集中所有用户的集合；uk*，vk*,表示不同视图下用户和景点的表征，表示用户u对景点v不同特征的偏好程度；g是sigmoid函数，Φ为内积函数；(4)将用户id及景点的特征输入到优化好的模型Y*，得到用户对景点的最终得分；(5)根据用户对测试目的地的所有景点的评分，按照评分排序得出评分最大的几个景点推荐给用户。2.根据权利要求1所述的方法，其中(2)中根据采集的多模态异质景点信息生成景点的评分特征X，景点图像特征MP、文本评论特征TC及景点区域流行度特征C，分别表示如下：该景点的文本评论特征TC，是将所有访问过景点的用户评论先进行分词、过滤无用词，再利用训练好的word2vec词向量模型将每个词映射为一个低维向量，然后利用景点评论的中所有单词的词向量构成景点的文本内容特征矩阵TC；该景点图像特征MP，是利用一个训练好的图像美学评估网络NIMA提取得到；该景点区域流行度特征C，为景点被所有用户的访问过的次数；该景点的评分特征X，为所有用户对景点的评分信息。3.根据权利要求1所述的方法，其中(3)中利用隐语义模型及神经网络构建个性化推荐模型Y，实现如下：3a)构建一个文本卷积网络Textcnn，将景点的文本特征TC输入到该Textcnn网络，得到相应的景点表征vt,并构建相应用户集合U的文本偏好表征矩阵Ut，该表征矩阵中每一行代表一个用户相应的表征ut，得到用户对景点文本特征的偏好得分预测为:yt＝Φ(ut,vt)；3b)构建多层感知机MLP网络Netp，将景点图像特征MP输入到Netp网络，得到相应的景点表征vp，构建相应用户集合U的图像偏好特征矩阵Up，该表征矩阵中每一行代表一个用户相应的表征up，得到用户对景点图像特征的偏好得分预测为:yp＝Φ(up,vp)；3c)构建多层感知机MLP网络Nets，将景点评分特征X输入到该Nets网络，得到相应的景点表征vs，构建相应用户集合U的评分偏好表征矩阵Us，该表征矩阵中每一行代表一个用户相应的表征us，得到用户对景点评分特征的偏好得分预测为:ys＝Φ(us,vs)；3d)构建目的地集合L的表征...

【专利技术属性】
技术研发人员：韩冰，张玉军，李浩然，高新波，王禛，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人