一种基于深度学习与贝叶斯概率矩阵分解的电影推荐方法技术

技术编号：21714582 阅读：17 留言：0更新日期：2019-07-27 19:15

一种基于深度学习与贝叶斯概率矩阵分解的电影推荐算法，属于电影推荐技术领域。在众多推荐系统中，矩阵分解模型因为其准确高效，易于实现得到广泛应用，但矩阵分解原理是将用户评分矩阵分为用户与项目特征向量，当评分矩阵稀疏时，推荐准确度将大大降低，为了解决这个问题，本方法将深度学习与基于协同的推荐算法相结合，利用堆栈自编码器学习用户与项目的辅助信息，贝叶斯概率分解矩阵从辅助信息和原有的评分中预测用户偏好。本方法在预测评分准确度方面有明显提升。

A Movie Recommendation Method Based on Deep Learning and Bayesian Probability Matrix Decomposition

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习与贝叶斯概率矩阵分解的电影推荐方法
本方法属于电影推荐
，具体设计结合深度学习与贝叶斯概率矩阵分解的电影推荐算法。
技术介绍
随着互联网的快速发展，数据爆发式增长，带来一定便利的同时也带来了困扰。针对海量影视数据，用户真正需要的信息则难以寻找。为了解决信息过载的问题，推荐系统应运而生。个性化推荐系统从众多数据中提取出有用的信息，通过收集用户的行为日志等数据，分析用户的兴趣并向其推荐相应信息。基于协同过滤的推荐算法是目前应用较为广泛的推荐算法之一。它利用用户之前的评分计算用户或电影相似度，学习用户与电影之间的潜在特征，从而进行评分预测。但这会造成无法推荐冷门电影，当新电影上映时，因为没有评分数据无法进行相似度计算。且仅靠评分无法准确挖掘用户，电影的潜在特征。近年来，深度学习模型在计算机视觉和自然语言处理领域展示出了巨大的潜力，深度学习可以有效捕捉到用户和物品之间的关系，将用户或物品用向量表示，获取他们的复杂特征。在NetflixPrize竞赛上，有人首次提出将深度学习加入到推荐算法中，受限玻尔兹曼机的出现使得竞赛上了一个新台阶。之后基于深度学习的推荐算法的相关研究急剧增加。但是众多算法依然存在耗时长，参数设置繁琐的问题。针对以上技术缺陷，本专利技术借助深度学习和基于模型的协同过滤的推荐算法解决这些问题。
技术实现思路
本专利技术解决的技术问题是：普通算法推荐准确度不高，易受稀疏数据和冷启动问题的影响，基于深度学习的推荐算法耗时长。针对上述问题，本专利技术提供了一种基于深度学习与贝叶斯概率矩阵分解模型的算法，步骤如下：步骤1.从网上公开数据集...

【技术保护点】
1.基于深度学习和贝叶斯概率矩阵分解的电影推荐算法，其特征在于，包括以下步骤：步骤1.从网上公开数据集获得用户，电影信息以及用户对电影的评分；步骤2.利用word2vec预处理用户与电影信息，将其转变为向量；步骤3.将用户向量输入用户侧栈式降噪自编码器，经过多次迭代，获取用户特征向量；将电影特征向量输入电影侧栈式降噪自编码器，经过多次迭代获取电影特征向量；步骤4.将用户特征向量与电影特征向量作为贝叶斯概率分解矩阵的初始值；步骤5.根据特征向量计算贝叶斯概率矩阵分解的参数，依照参数更新特征向量，多次重复，直至用户特征向量与电影特征向量内积与现有评分之间的误差低于0.4；步骤6.根据预测评分进行电影推荐。

【技术特征摘要】
1.基于深度学习和贝叶斯概率矩阵分解的电影推荐算法，其特征在于，包括以下步骤：步骤1.从网上公开数据集获得用户，电影信息以及用户对电影的评分；步骤2.利用word2vec预处理用户与电影信息，将其转变为向量；步骤3.将用户向量输入用户侧栈式降噪自编码器，经过多次迭代，获取用户特征向量；将电影特征向量输入电影侧栈式降噪自编码器，经过多次迭代获取电影特征向量；步骤4.将用户特征向量与电影特征向量作为贝叶斯概率分解矩阵的初始值；步骤5.根据特征向量计算贝叶斯概率矩阵分解的参数，依照参数更新特征向量，多次重复，直至用户特征向量与电影特征向量内积与现有评分之间的误差低于0.4；步骤6.根据预测评分进行电影推荐。2.根据权利要求1所述的基于深度学习和贝叶斯概率矩阵分解的电影推荐算法，其特征在于，步骤2具体为：利用word2vec预处理用户与电影信息，将其转变为向量；因电影标题由多个词汇构成，且有大写字母，所以先将所有大写字母转换为小写字母，将所有标题中的词汇组成词汇表，所有词由one-hot编码转化为词向量，然后对word2vec网络输入需要预测词的上下文向量进行该词预测，至少训练10次，保留网络参数，所有词乘以相应参数获得最终词向量；取该电影标题所有的词向量的平均值获得该电影标题向量，将电影标题向量和电影流派向量取平均值获得电影向量；将用户性别，职业也利用word2vec转化为相应的向量表达，取两个向量的平均值作为用户向量。3.根据权利要求1所述的基于深度学习和贝叶斯概率矩阵分解的电影推荐算法，其特征在于，步骤3具体为：向原始用户向量加入噪声,生成第一个DAE输入向量，利用DAE的重构原理迭代训练50次，所有向量重构误差总和低于50，得到第一个隐藏层的各项参数和特征向量1，公式如下h＝fθ(x)＝s(Wx+b)；h为第...

【专利技术属性】
技术研发人员：张延华，王倩雯，付琼霄，张文博，李庆，陈冰容，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人