A collaborative filtering recommendation method based on cascade sparse denoising and self-encoding enhancement involves the technical field of personalized recommendation algorithm. The invention extracts user and item characteristic information from user basic information and item basic information by using deep learning model cascade sparse denoising self-encoder (sSDAE), multiplies with implicit factor model algorithm, calculates corresponding algorithm with user item score matrix, forms final recommendation result, forms recommendation list for user, and carries on personalization. Recommend. This invention uses the depth model cascade sparse noise reduction self-encoder to process the information of users and projects, and fuses the basic information of users and projects into the rating information of users and projects through the implicit factor model (matrix decomposition method), predicts the rating of users to projects, and completes the recommendation task. The invention effectively improves the problem of low accuracy caused by cold start and sparse data.
【技术实现步骤摘要】
一种基于层叠稀疏降噪自编码器增强的协同过滤推荐方法
本专利技术涉及的领域为个性化推荐算法
,特别涉及一种融入辅助信息的基于层叠稀疏降噪自编码器增强的协同过滤推荐算法技术。
技术介绍
随着大数据、云计算等技术的高速发展,我们进入了信息爆炸的时代,因此我们也面临着各种各样的爆炸式增长的信息、数据。数据中蕴含着丰富的内容和价值,具有很大的潜力,但与此同时,也出现了“信息过载”的现象。怎样有效地从多种复杂、繁多结构的数据中获取最有价值的信息,成为了目前大数据处理的关键。推荐系统作为解决“信息过载”的一种有效方法,通过推荐算法从海量的数据里挖掘出用户感兴趣的信息,并将结果以个性化列表的形式推荐给用户,目前在各个领域已经得到了广泛、成功的应用。传统的推荐方法主要包括基于内容的推荐方法和协同过滤推荐方法。其中,最经典的算法是协同过滤算法,其是目前应用最广泛的推荐算法,它可以基于用户,或者基于项目,计算用户或项目间的相似度,如是基于用户,则把和要预测的用户最相近的用户喜欢的项目推荐给该用户,完成推荐,基于项目的协同过滤与此类似,只是用户、项目反过来衡量来完成个性化推荐。协同过滤中的矩阵因子分解算法,利用用户与项目之间的交互信息(用户对项目的行为,包括且不仅包括评分等)为用户进行推荐。近年来协同过滤算法在Netflix大奖赛中屡获大奖,但是也遭遇了严重的数据稀疏问题,如我们经常浏览各种信息、物品,却鲜少对里面的项目进行了评价等交互,这样,计算机很难从极少的显式交互行为中完成对我们兴趣的预测。最严重的数据稀疏结果,对于单个的用户、项目来说,即一个用户对任何项目没有任何交 ...
【技术保护点】
1.一种基于层叠稀疏降噪自编码器增强的协同过滤推荐方法,其特征在于:该方法包括数据预处理模块、层叠稀疏降噪自编码器模块、隐含因子模型模块;层叠稀疏降噪自编码器模块与隐含因子模型模块由三部分构成,其中左右两部分代表基于sSDAE的用户、项目特征提取模型,中间部分代表基于LFM的协同过滤模型;其中,左、右两侧的特征提取部分,输入分别为处理过的用户基本信息、项目基本信息,输出为用户‑特征、项目‑特征的隐藏层表示,以此来进行用户、项目的深层特征提取;在中间的LFM模型部分,改进LFM,使用sSDAE模型提取的隐藏层特征矩阵替换掉LFM模型里初始化的用户‑特征、项目‑特征矩阵,进行矩阵相乘,最终与用户‑项目评分矩阵进行损失最小化计算,使用随机梯度下降法得到最优解,最后用得到的相乘矩阵作为用户对项目的预测评分矩阵进行推荐。
【技术特征摘要】
1.一种基于层叠稀疏降噪自编码器增强的协同过滤推荐方法,其特征在于:该方法包括数据预处理模块、层叠稀疏降噪自编码器模块、隐含因子模型模块;层叠稀疏降噪自编码器模块与隐含因子模型模块由三部分构成,其中左右两部分代表基于sSDAE的用户、项目特征提取模型,中间部分代表基于LFM的协同过滤模型;其中,左、右两侧的特征提取部分,输入分别为处理过的用户基本信息、项目基本信息,输出为用户-特征、项目-特征的隐藏层表示,以此来进行用户、项目的深层特征提取;在中间的LFM模型部分,改进LFM,使用sSDAE模型提取的隐藏层特征矩阵替换掉LFM模型里初始化的用户-特征、项目-特征矩阵,进行矩阵相乘,最终与用户-项目评分矩阵进行损失最小化计算,使用随机梯度下降法得到最优解,最后用得到的相乘矩阵作为用户对项目的预测评分矩阵进行推荐。2.根据权利要求1所述的一种基于层叠稀疏降噪自编码器增强的协同过滤推荐方法,其特征在于,下面是基于层叠稀疏降噪自编码器增强的协同过滤算法:输入:用户-项目评分矩阵用户的基本信息x1,项目的基本信息x2;输出:用户的top-N推荐列表;Step1将用户的基本信息、项目的基本信息转为数字形式,对项目包含的自然语言进行自然语言处理,使用TF-IDF舍弃停用词,形成词汇表,使用one-hot编码将用户的基本信息、项目的基本信息转化为层叠稀疏降噪自编码器能够处理的向量信息;Step2随机初始化噪声系数在0-1区间,对用户的基本信息、项目的基本信息加入噪声,使用随机置0法,由输入向量x加入噪音得到x',则加噪的用户基本信息为x1',加噪的项目基本信息为x2';Step3初始化稀疏降噪自编码器SDA的各参数:稀疏降噪自编码器稀疏惩罚因子γ=0.01;稀疏性参数ρ=0.001;随机均匀分布法初始化We;Wd;be;bd;初始化层叠稀疏降噪自编码器最内层神经元节点数B=50;Step4将Step1、Step2处理得到的用户的基本信息x1'、项目的基本信息x2'分别作为输入;计算隐藏层神经元的平均激活度:yj代表的是隐藏神经元j的激活度,则yj(x(i))表示的是输入为x的情况下,自编码器神经网络隐藏神经元j的激活度,K为样本个数,为达稀疏性限制的作用,加入以下限制:其中,ρ为稀疏性参数,普遍取值0.001,上式表示让隐藏神经元j的平均活跃度接近ρ;为实现稀疏限制,在优化目标函数中加入额外的惩罚因子,最小...
【专利技术属性】
技术研发人员:蒋宗礼,董璇,张秀英,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。