一种基于改进矩阵分解与跨通道卷积神经网络的推荐方法技术

技术编号:21200252 阅读:38 留言:0更新日期:2019-05-25 01:21
本发明专利技术公开了一种基于改进矩阵分解与跨通道卷积神经网络的推荐方法,在矩阵分解推荐模型的基础上加入用户和项目的影响因子,得到改进矩阵分解推荐模型;然后在卷积神经网络的卷积层后面添加一层跨通道卷积层,得到改进后的跨通道卷积神经网络;最后将改进矩阵分解模型与跨通道卷积神经网络融合后进行推荐。本发明专利技术具有泛化能力强、同等训练条件下,对文本的识别率较高等优点。

A Recommendation Method Based on Improved Matrix Decomposition and Cross-Channel Convolutional Neural Network

The invention discloses a recommendation method based on improved matrix decomposition and cross-channel convolution neural network, which adds influence factors of users and projects on the basis of matrix decomposition recommendation model to obtain improved matrix decomposition recommendation model, and then adds a cross-channel convolution layer behind the convolution layer of convolution neural network to obtain the improved cross-channel convolution neural network. The improved matrix decomposition model and cross-channel convolution neural network are fused and recommended. The invention has the advantages of strong generalization ability, high text recognition rate under the same training conditions.

【技术实现步骤摘要】
一种基于改进矩阵分解与跨通道卷积神经网络的推荐方法
本专利技术涉及电商网站和视频网站推荐的
,尤其涉及到一种基于改进矩阵分解与跨通道卷积神经网络的推荐方法。
技术介绍
在电子商务中,推荐系统的应用越来越广泛,推荐模型预测结果对准确率的要求不言而喻,随着用户和项目数量呈现爆炸性的增长,推荐系统面临两方面的挑战。一方面,用户和项目数量的爆炸式增长加剧了用户对项目评分数据的稀疏性,这种数据稀疏性会降低传统推荐模型预测的准确性。另一方面,现在不论是电子商务网站还是主流社交软件,用户对于项目的文字评价数据越来越多,需要一种既可以利用用户给项目的评分数据又可以识别用户-项目评价信息的推荐模型,这样就可以最大效率利用已有且易收集的数据从而做出准确的推荐。传统矩阵分解与卷积神经网络融合的推荐模型尽管利用了用户对项目的分数评价和文字评价信息,但有两个缺点:(1)模型的泛化能力不够。(2)同等训练条件下,卷积神经网络对文本的识别率较低。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提出一种泛化能力强、同等训练条件下,对文本的识别率较高的基于改进矩阵分解与跨通道卷积神经网络的推荐方法。为实现上述目的,本专利技术所提供的技术方案为:一种基于改进矩阵分解与跨通道卷积神经网络的推荐方法,在矩阵分解推荐模型的基础上加入用户和项目的影响因子,得到改进矩阵分解推荐模型;然后在卷积神经网络的卷积层后面添加一层跨通道卷积层,得到改进后的跨通道卷积神经网络;最后将改进矩阵分解模型与跨通道卷积神经网络融合后进行推荐。进一步地,所述在矩阵分解推荐模型的基础上加入用户和项目的影响因子,得到改进矩阵分解推荐模型的具体步骤如下:矩阵分解推荐模型是指把用户-项目评分矩阵R分解成两个低维矩阵P和Q的乘积:R=PTQ(1)假定有U个用户,D个项目,R为评分矩阵;假定有K个隐含变量,找到矩阵PK×U和QK×D;p和q分别代表矩阵P和矩阵Q的行向量和列向量,将用户的评分矩阵R分解成矩阵PK×U和QK×D,PK×U的转置乘以QK×D既满足评分矩阵R已有的值,同时也填充未评分的项;定义损失函数,为避免过拟合,将损失函数正则化:用户有自己的打分喜好,存在对项目评分非常严格或者非常宽松的情况,称第i个用户的偏执为bi;项目可能会因为一些特殊因素让其相对于其它商品更容易获得用户的低分或者高分,称第j个项目的偏执为bj;从而得到:其中,表示改进矩阵分解模型对用户评分的预测值,u表示用户对项目打分平均值;从而得到改进矩阵分解模型:式中,L(P,Q)表示损失函数,rij代表原评分矩阵的元素,u表示用户对项目打分平均值,bi表示第i个用户对项目的偏执,bj表示第j个项目相对其他项目的偏执,||pi||2、||qj||2、||bi||2和||bj||2分别表示各对应矩阵中向量的欧几里得范数,λ1、λ2、λ3和λ4表示正则化平衡系数。进一步地,所述在卷积神经网络的卷积层后面添加一层跨通道卷积层,得到改进后的跨通道卷积神经网络的具体步骤如下:卷积神经网络的卷积层通过一个线性的卷积滤波器得到特征图,再经过非线性激活,其计算特征图的表达式如下:其中,(i,j)为特征图的坐标,xi,j为滑动窗口中以(i,j)为中心位置的输入,k为特征图的通道索引,ω为权重向量,b为偏执项,max()为非线性激励函数;对于经过预处理的词向量,为了提取更抽象的特征,同时考虑训练网络的运算量,在卷积层后面再增加一层跨通道卷积层,以提高模型的表达能力,根据式(5),改进的模型如式(6)、(7):其中,式(6)为基本卷积层,为卷积层中第k1张特征图与输入层的权向量;式(7)为跨通道卷积层,为卷积层中第k2张特征图与基本卷积层的权向量。进一步地,所述将改进矩阵分解模型与跨通道卷积神经网络融合后进行推荐的具体步骤如下:S1:对于用户关于项目的评分,整理出打分矩阵R;对于用户关于项目的文字评价,预处理成词向量;S2:将打分矩阵R进行矩阵分解,加入用户和项目的偏执;S3:将词向量组成信息矩阵,建立跨通道的卷积神经网络进行文本识别,得到该评价信息的特征值;S4:将步骤S3得到的特征值与步骤S2中改进矩阵分解模型中的正则化项进行融合,对融合推荐模型的损失函数,根据参数设定,运用梯度下降法进行训练,当损失函数小于0.01时,停止训练;S5:模型训练完,得到矩阵PK×U和QK×D,PK×U的转置和QK×D的乘积重构评分矩阵此时,评分矩阵已填补了用户关于某些项目未评价的项,根据这些补齐的打分项,从大到小进行排序,对用户进行一些项目的推荐。进一步地,所述融合推荐模型的损失函数如下:其中,L(P,Q,W)表示损失函数,rij代表原评分矩阵的元素,u表示用户对项目打分平均值,bi表示第i个用户对项目的偏执,bj表示第j个项目相对其他项目的偏执,cnn(W,Xi)表示项目评价信息经改进卷积神经网络识别成有意义的打分值,||pi||2、||qj||2、||bi||2、||bj||2和||wk||2分别表示各对应矩阵中向量的欧几里得范数,λ1、λ2、λ3、λ4和λ5表示正则化平衡系数。与现有技术相比,本方案原理和优点如下:1.在传统矩阵分解模型基础上加入了用户和项目的影响因子,提高预测模型的泛化能力。2.对用户关于项目的文字评价信息,本方案建立跨通道卷积神经网络对该文字信息进行识别,同等训练条件下,跨通道卷积神经网络对文本的识别率要高,将改进的矩阵分解模型与改进卷积神经网络进行融合,提高预测模型的整体推荐性能。附图说明图1为本专利技术一种基于改进矩阵分解与跨通道卷积神经网络的推荐方法中改进后的跨通道CNN层次结构图;图2为本专利技术一种基于改进矩阵分解与跨通道卷积神经网络的推荐方法中改进矩阵分解与跨通道卷积神经网络模型图。具体实施方式下面结合具体实施例对本专利技术作进一步说明:本实施例所述的一种基于改进矩阵分解与跨通道卷积神经网络的推荐方法,具体步骤如下:第一步:在矩阵分解推荐模型的基础上加入用户和项目的影响因子,得到改进矩阵分解推荐模型;具体解析如下:矩阵分解推荐模型是指把用户-项目评分矩阵R分解成两个低维矩阵P和Q的乘积:R=PTQ(1)假定有U个用户,D个项目,R为评分矩阵;假定有K个隐含变量,找到矩阵PK×U和QK×D;p和q分别代表矩阵P和矩阵Q的行向量和列向量,将用户的评分矩阵R分解成矩阵PK×U和QK×D,PK×U的转置乘以QK×D既满足评分矩阵R已有的值,同时也填充未评分的项;定义损失函数,为避免过拟合,将损失函数正则化:用户有自己的打分喜好,存在对项目评分非常严格或者非常宽松的情况,称第i个用户的偏执为bi;项目可能会因为一些特殊因素让其相对于其它商品更容易获得用户的低分或者高分,称第j个项目的偏执为bj;从而得到:其中,表示改进矩阵分解模型对用户评分的预测值,u表示用户对项目打分平均值;从而得到改进矩阵分解模型:式中,L(P,Q)表示损失函数,rij代表原评分矩阵的元素,u表示用户对项目打分平均值,bi表示第i个用户对项目的偏执,bj表示第j个项目相对其他项目的偏执,||pi||2、||qj||2、||bi||2和||bj||2分别表示各对应矩阵中向量的欧几里得范数,λ1、λ2、λ3和λ4表示正则化平衡系数,一般取较小值。本文档来自技高网...

【技术保护点】
1.一种基于改进矩阵分解与跨通道卷积神经网络的推荐方法,其特征在于,在矩阵分解推荐模型的基础上加入用户和项目的影响因子,得到改进矩阵分解推荐模型;然后在卷积神经网络的卷积层后面添加一层跨通道卷积层,得到改进后的跨通道卷积神经网络;最后将改进矩阵分解模型与跨通道卷积神经网络融合后进行推荐。

【技术特征摘要】
1.一种基于改进矩阵分解与跨通道卷积神经网络的推荐方法,其特征在于,在矩阵分解推荐模型的基础上加入用户和项目的影响因子,得到改进矩阵分解推荐模型;然后在卷积神经网络的卷积层后面添加一层跨通道卷积层,得到改进后的跨通道卷积神经网络;最后将改进矩阵分解模型与跨通道卷积神经网络融合后进行推荐。2.根据权利要求1所述的一种基于改进矩阵分解与跨通道卷积神经网络的推荐方法,其特征在于,所述在矩阵分解推荐模型的基础上加入用户和项目的影响因子,得到改进矩阵分解推荐模型的具体步骤如下:矩阵分解推荐模型是指把用户-项目评分矩阵R分解成两个低维矩阵P和Q的乘积:R=PTQ(1)假定有U个用户,D个项目,R为评分矩阵;假定有K个隐含变量,找到矩阵PK×U和QK×D;p和q分别代表矩阵P和矩阵Q的行向量和列向量,将用户的评分矩阵R分解成矩阵PK×U和QK×D,PK×U的转置乘以QK×D既满足评分矩阵R已有的值,同时也填充未评分的项;定义损失函数,为避免过拟合,将损失函数正则化:用户有自己的打分喜好,存在对项目评分非常严格或者非常宽松的情况,称第i个用户的偏执为bi;项目可能会因为一些特殊因素让其相对于其它商品更容易获得用户的低分或者高分,称第j个项目的偏执为bj;从而得到:其中,表示改进矩阵分解模型对用户评分的预测值,u表示用户对项目打分平均值;从而得到改进矩阵分解模型:式中,L(P,Q)表示损失函数,rij代表原评分矩阵的元素,u表示用户对项目打分平均值,bi表示第i个用户对项目的偏执,bj表示第j个项目相对其他项目的偏执,||pi||2、||qj||2、||bi||2和||bj||2分别表示各对应矩阵中向量的欧几里得范数,λ1、λ2、λ3和λ4表示正则化平衡系数。3.根据权利要求1所述的一种基于改进矩阵分解与跨通道卷积神经网络的推荐方法,其特征在于,所述在卷积神经网络的卷积层后面添加一层跨通道卷积层,得到改进后的跨通道卷积神经网络的具体步骤如下:卷积神经网络的卷积层通过一个线性的卷积滤波器得到特征图,再经过非线性激活,其计算特征图的表达式如下:其中,(i...

【专利技术属性】
技术研发人员:翁海瑞林穗
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1