当前位置: 首页 > 专利查询>武汉大学专利>正文

基于协同过滤和深度学习的个性化推荐方法及系统技术方案

技术编号:27938467 阅读:17 留言:0更新日期:2021-04-02 14:19
本发明专利技术提供一种基于协同过滤和深度学习的个性化推荐方法及系统,包括获取用户购买商品的历史行为特征数据,并进行预处理,将用户的购买行为按照时间进行排序,排序后的数据称为用户的行为特征序列;个性化推荐系统建模,包括从交互矩阵中获取用户和商品的输入向量,然后分别生成用户和商品的嵌入向量,再经过注意力神经网络对嵌入向量进行加权,加权后的嵌入向量再进行线性和非线性的交互,从而获取用户和商品之间的显式和隐式关系,最后进行用户对商品的点击率预估;使用用户行为特征序列进行模型的训练和测试。本发明专利技术充分挖掘了用户的和商品的协同信号,为捕捉用户的个性化需求提供基础,能够提高推荐系统准确度和可解释性。

【技术实现步骤摘要】
基于协同过滤和深度学习的个性化推荐方法及系统
本专利技术涉及互联网中推荐系统的
,具体涉及到一种基于协同过滤和深度学习的个性化推荐方法及系统。
技术介绍
随着人类生活的网络化,网络中的数据量在爆发式的增加,而这些数据中所带有的信息也在与日俱增,在人们的日常网络生活中,越来越多的应用开始关注利用这些信息来改善用户的上网体验,推荐系统应运而生。相应技术也在日益增多,例如:CN109410001B提供了了一种商品推荐方法、系统、电子设备和存储介质,获取商品的文本词组的权值,并对文本词组进行向量化得到相应的加权文本词向量;通过预设的聚类算法对加权文本词向量进行聚类;在聚类内计算加权文本词向量间的距离,获取预设的高频词元素近似结果;根据预设的高频词元素近似结果,生成相应的商品推荐结果。CN111523042B涉及用于推荐商品的方法、装置、电子设备和计算机存储介质,基于用户点击商品记录,生成与用户标识相关联的点击商品标识序列;基于当前时间和与商品标识相关联的活动截止时间,确定与商品标识相关联的剩余时间;基于点击商品标识序列和与商品标识相关联的剩余时间,生成商品共现元组,商品共现元组包括点击商品标识序列中的两个商品标识以及权重;基于商品共现元组,生成与商品标识相关联的商品表示;以及基于商品表示之间的相似度,确定与商品标识相关联的推荐商品。由此,在确定推荐商品时考虑商品的活动截止时间,避免推荐商品的时效性问题。目前,不管是在学术界还是在工业界中,协同过滤算法因为其性能优良和可用性强在推荐系统领域受到广泛关注,基于协同过滤的推荐系统简单来说就是利用用户以往购买行为,过滤出用户可能感兴趣的商品,从而进行商品推荐。其中基于隐语义模型的协同过滤会采用到用户-商品交互矩阵,然后进行矩阵分解或嵌入式等操作来得到用户和商品的隐性特征表示(隐向量),最后将隐向量进行相似度计算,相似度越高,说明用户对商品的兴趣度越大。传统的协同过滤都是采用线性结合的方式来预测用户对商品的喜好。随着深度学习的不断发展和完善,越来越多的推荐模型将深度神经网络结合到已有的模型中,很好的解决了线性模型只能通过线性函数来进行数据建模的问题,深度学习模型采用深度神经网络帮助模型提取用户和商品的非线性特征关系,学习潜在的用户兴趣,从而更准确地捕捉用户对商品的偏好信息。例如:CN107038609A提供一种基于深度学习的商品推荐方法,结合深度学习的方法对文本进行细化处理,并将其通过模糊隶属函数进行量化,可将用户的评论转化为对商品各项属性的打分情况,再结合协同过滤方法进行推荐。注意力模型或者说注意力这种思想已经是深度学习中最重要的思想之一,其最初应用于视觉领域,后来有被用于机器翻译,他可以通过计算注意力权重来告诉模型需要将多少注意力放在相应的信息处。现在越来越多的推荐系统将此类方法引用到自己的模型上,注意力机制不仅可以提高系统的准确度,还可以增强系统的可解释性。就协同过滤的模型来说,采用注意力机制可以计算出用户的历史行为中哪些行为更具有价值,对用户的下一行为产生更大的影响,进而系统可以据此信息提供更准确的推荐服务。但是,目前大多数存在的基于深度学习的协同过滤推荐模型存在如下问题:1、当前应用较多的协同过滤模型在计算用户和商品的隐性特征向量时采用嵌入式的方法,在此方法中大多数模型都是将用户和商品表示为独热编码,然后通过嵌入矩阵得到对应的隐向量,这样的方法没有充分利用用户-商品交互矩阵中的信息,例如,用户以往购买过哪些商品,某商品以往被哪些用户购买过,这些通过此编码方式都无法得知,而这些信息在对用户进行个性化推荐时往往非常重要。2、基于深度学习的推荐模型旨在挖掘用户和商品的非线性特征关系,但是他们往往忽略了在低阶交互中显式编码的协同信号,这些在低阶交互中捕捉的线性特征关系往往也是个性化推荐的关键。3、利用用户以往购买信息对用户进行商品推荐时,并不是所有商品对用户的下一购买行为的影响程度都是一样的,例如,偏爱电子商品的用户以往购买过鼠标、键盘和帽子,那么,系统就应该更加关注于鼠标和键盘对下一购买行为的影响,但是在很多推荐系统中,这种思想没有得到体现。
技术实现思路
本专利技术针对现有模型的不足,提出了一种基于协同过滤和深度学习的个性化推荐方法。该方法改进了传统协同过滤算法对用户和商品编码存在的不足,以及结合深度神经网络,通过注意力神经网络根据不同的用户进行兴趣挖掘,同时根据不同的商品进行用户兴趣划分,最后将带有兴趣偏好的用户和商品向量进行线性和非线性的交互,从而进行更精准的商品推荐,大力提高个性化推荐的准确率和可解释性。本专利技术所提供的技术方案是一种基于协同过滤和深度学习的个性化推荐方法,包括以下步骤,步骤1,获取用户购买商品的历史行为特征数据,并进行预处理,将用户的购买行为按照时间进行排序,排序后的数据称为用户的行为特征序列;步骤2,个性化推荐系统建模,所述个性化推荐系统包括依次设置的如下部分,输入层,用于将用户的编码和商品的编码分别表示为用户输入向量和商品输入向量,所述用户的编码包括用户的多热编码和用户的独热编码,所述商品的编码包括商品的多热编码和商品的独热编码;嵌入层,用于将用户输入向量和商品输入向量降维,得到用户的嵌入向量和物品的嵌入向量;所述用户u的嵌入向量包括其历史购买商品对应的嵌入向量的集合,构成用户u的嵌入特征;所述商品v的嵌入向量包括其历史购买者对应的嵌入向量的集合,构成商品v的嵌入特征;注意力神经网络,用于对嵌入向量进行加权,包括对于每一个用户计算出其历史购买商品的注意力权重,以衡量用户u偏向于购买哪些物品;对于每一个物品计算出其历史购买者的注意力权重,以衡量物品v偏向于被哪些用户购买;交互层,用于将加权后的隐向量进行线性和非线性的交互,获取用户和商品之间的显式和隐式关系;融合层和输出层,用于进行用户对商品的点击率预估,包括对交互层中线性和非线性子部分得到的输出进行融合,得到最后的用户和目标商品之间的交互关系,再据此计算用户购买目标商品的概率,概率越大,则购买的可能性越大;步骤3,使用用户行为特征序列进行模型的训练和测试,对测试的商品通过点击率的高低进行排序,然后选取前若干项进行推荐。而且,在步骤1中,需要获取的数据包括所有用户的ID值,所有商品的ID值,以及所有用户的购买记录,并将用户的购买记录按照购买时间进行排序;选择用户最近一次的购买记录作为模型的测试集,倒数第二次购买记录作为模型的验证集,其余购买记录作为模型的训练集;构建隐式反馈交互矩阵M,矩阵大小为m×n,m表示用户的数量,n表示商品的数量,矩阵中的数值为1表示用户购买过此商品,数值为0表示用户未购买过此商品;矩阵的第i行表示ID值为i的用户的购买记录,矩阵的第j列表示ID值为j的商品被购买记录。而且,在输入层中,针对每一个用户,使用交互矩阵M中其ID值对应的行对其进行编码,称之为用户的多热编码;针对每一个商品,使用交互矩阵M中其ID值对应的列对其进行编码,称本文档来自技高网
...

【技术保护点】
1.一种基于协同过滤和深度学习的个性化推荐方法,其特征在于,包括以下步骤,/n步骤1,获取用户购买商品的历史行为特征数据,并进行预处理,将用户的购买行为按照时间进行排序,排序后的数据称为用户的行为特征序列;/n步骤2,个性化推荐系统建模,所述个性化推荐系统包括依次设置的如下部分,/n输入层,用于将用户的编码和商品的编码分别表示为用户输入向量和商品输入向量,所述用户的编码包括用户的多热编码和用户的独热编码,所述商品的编码包括商品的多热编码和商品的独热编码;/n嵌入层,用于将用户输入向量和商品输入向量降维,得到用户的嵌入向量和物品的嵌入向量;所述用户u的嵌入向量包括其历史购买商品对应的嵌入向量的集合,构成用户u的嵌入特征;所述商品v的嵌入向量包括其历史购买者对应的嵌入向量的集合,构成商品v的嵌入特征;/n注意力神经网络,用于对嵌入向量进行加权,包括对于每一个用户计算出其历史购买商品的注意力权重,以衡量用户u偏向于购买哪些物品;对于每一个物品计算出其历史购买者的注意力权重,以衡量物品v偏向于被哪些用户购买;/n交互层,用于将加权后的隐向量进行线性和非线性的交互,获取用户和商品之间的显式和隐式关系;/n融合层和输出层,用于进行用户对商品的点击率预估,包括对交互层中线性和非线性子部分得到的输出进行融合,得到最后的用户和目标商品之间的交互关系,再据此计算用户购买目标商品的概率,概率越大,则购买的可能性越大;/n步骤3,使用用户行为特征序列进行模型的训练和测试,对测试的商品通过点击率的高低进行排序,然后选取前若干项进行推荐。/n...

【技术特征摘要】
1.一种基于协同过滤和深度学习的个性化推荐方法,其特征在于,包括以下步骤,
步骤1,获取用户购买商品的历史行为特征数据,并进行预处理,将用户的购买行为按照时间进行排序,排序后的数据称为用户的行为特征序列;
步骤2,个性化推荐系统建模,所述个性化推荐系统包括依次设置的如下部分,
输入层,用于将用户的编码和商品的编码分别表示为用户输入向量和商品输入向量,所述用户的编码包括用户的多热编码和用户的独热编码,所述商品的编码包括商品的多热编码和商品的独热编码;
嵌入层,用于将用户输入向量和商品输入向量降维,得到用户的嵌入向量和物品的嵌入向量;所述用户u的嵌入向量包括其历史购买商品对应的嵌入向量的集合,构成用户u的嵌入特征;所述商品v的嵌入向量包括其历史购买者对应的嵌入向量的集合,构成商品v的嵌入特征;
注意力神经网络,用于对嵌入向量进行加权,包括对于每一个用户计算出其历史购买商品的注意力权重,以衡量用户u偏向于购买哪些物品;对于每一个物品计算出其历史购买者的注意力权重,以衡量物品v偏向于被哪些用户购买;
交互层,用于将加权后的隐向量进行线性和非线性的交互,获取用户和商品之间的显式和隐式关系;
融合层和输出层,用于进行用户对商品的点击率预估,包括对交互层中线性和非线性子部分得到的输出进行融合,得到最后的用户和目标商品之间的交互关系,再据此计算用户购买目标商品的概率,概率越大,则购买的可能性越大;
步骤3,使用用户行为特征序列进行模型的训练和测试,对测试的商品通过点击率的高低进行排序,然后选取前若干项进行推荐。


2.根据权利要求1所述的一种基于协同过滤和深度学习的个性化推荐方法,其特征在于:在步骤1中,需要获取的数据包括所有用户的ID值,所有商品的ID值,以及所有用户的购买记录,并将用户的购买记录按照购买时间进行排序;选择用户最近一次的购买记录作为模型的测试集,倒数第二次购买记录作为模型的验证集,其余购买记录作为模型的训练集;
构建隐式反馈交互矩阵M,矩阵大小为m×n,m表示用户的数量,n表示商品的数量,矩阵中的数值为1表示用户购买过此商品,数值为0表示用户未购买过此商品;矩阵的第i行表示ID值为i的用户的购买记录,矩阵的第j列表示ID值为j的商品被购买记录。


3.根据权利要求2所述的一种基于协同过滤和深度学习的个性化推荐方法,其特征在于:在输入层中,针对每一个用户,使用交互矩阵M中其ID值对应的行对其进行编码,称之为用户的多热编码;针对每一个商品,使用交互矩阵M中其ID值对应的列对其进行编码,称之为商品的多热编码;同时,对每一个用户的ID和每一个物品的ID进行独热编码表示。


4.根据权利要求3所述的一种基于协同过滤和深度学习的个性化推荐方法,其特征在于:在嵌入层中,采用两个嵌入矩阵来对用户输入向量和商品输入向量进行降维,实现如下,
用于对用户特征降维的嵌入矩阵为P∈Rm×k,其中m表示用户的数量,k表示低维空间的维度,用于对商品特征降维的嵌入矩阵为Q∈Rn×k,其中n表示物品的数量,k表示低维空间的维度;
针对每一个用户u,都能够在嵌入矩阵P中找到其ID值对应的嵌入向量tu,然后在嵌入矩阵Q中找到用户u的所有历史购买商品的嵌入向量qj∈Q,则用户u的嵌入特征表示为其中表示用户u的历史购买的商品的集合;
针对每一个商品v,都能够根据其ID值,在嵌入矩阵Q中找到对应的嵌入向量tv,然后对于商品v的所有历史购买者根据嵌入矩阵P生成对应的嵌入向量pi∈P,其特征表示为其中表示物品v的历史购买者的集合。


5.根据权利要求4所述的一种基于协同过滤和深度学习的个性化推荐方法,其特征在于:在注意力神经网络中,采用基于单层神经网络的注意力模型;
在注意力模型中,选择采用点积的方式来表示历史项与目标项之间的相似度,然后使用一个带有隐藏层的多层感知器来参数化此相似度,再将输出的参数经过softmax进行归一化得到最后的注意力权重;
得到用户和商品的注意力权重后,基...

【专利技术属性】
技术研发人员:吴黎兵闵姝文全聪
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1