一种面向用户动态偏好的商品序列个性化推荐方法技术

技术编号:22566126 阅读:48 留言:0更新日期:2019-11-16 12:28
本发明专利技术公开一种面向用户动态偏好的商品序列个性化推荐的方法,包括提取同一用户相似评分下的商品序列构造出商品评分向量,同时提取同一商品相似评分的用户序列得到用户评分向量,然后结合用户个人信息、商品基本属性信息、用户和物品评论以及商品图片,基于多任务学习来分别实现用户和商品的特征抽取,以用户特征向量及其历史商品序列的特征向量作为输入,通过训练编码‑解码器来实现商品序列的生成,并结合搜索策略精确学习最优商品序列的推荐。本发明专利技术基于多模态的用户‑商品数据,高度提取及融合用户特征和商品特征,实现面向用户偏好的商品序列的个性化推荐,提高用户体验。

A method of product sequence personalized recommendation for users' dynamic preferences

The invention discloses a method of personalized recommendation of commodity sequence for user's dynamic preference, which includes extracting the commodity sequence under the same user's similar score to construct the commodity scoring vector, simultaneously extracting the user sequence of the same commodity's similar score to obtain the user's scoring vector, and then combining the user's personal information, the basic attribute information of the commodity, the user's and the article's comments and the commodity picture Based on multi task learning, the feature extraction of users and commodities is realized respectively. The user feature vector and the feature vector of historical commodity sequence are used as input, and the generation of commodity sequence is realized by training the coding \u2011 decoder, and the recommendation of optimal commodity sequence is accurately learned by combining the search strategy. Based on multi-modal user \u2011 commodity data, the invention highly extracts and integrates user features and commodity features, realizes personalized recommendation of commodity sequence oriented to user preferences, and improves user experience.

【技术实现步骤摘要】
一种面向用户动态偏好的商品序列个性化推荐方法
本专利技术涉及智能商业领域,特别涉及一种面向用户动态偏好的商品序列个性化推荐方法。
技术介绍
随着大数据时代的到来,大量用户每时每刻都在产生大量的信息,这些信息项非常庞大,如何有效的从庞大的数据中提取有效特征进行推荐是需要亟待解决的一个问题。在推荐领域中不同用户之间的信息偏好是不同的,但是相似的用户和商品之间又存在一定的相关性。如何在大数据背景下,提出一种高效合理的个性化推荐方法是非常值得研究的热点。现有的推荐算法往往利用用户和商品之间的关系矩阵,并结合二者之间的其他特征进行推荐,虽然可以对推荐结果提供一定的参考,但是这些推荐系统存在如下缺点:它们对于大数据量的用户和物品信息处理效率较低,而且容易忽略用户的动态历史偏好以及用户对历史商品的评价,不能够对以往推荐结果进行很好的反馈;其次,传统的推荐系统模型简单,用户特征单一,采用概率统计方法进行评价,存在一定的局限性,推荐时间长,误差较大;传统的推荐系统没有结合商品的图片特征,任务单一,无法定性地对用户的历史评论以及商品的图片进行分析,进而无法对推荐特征进行有效的评估;最后,传统的推荐算法里面忽视了用户评分相同的商品序列以及商品对应的用户序列之间的序列信息,而且对推荐结果没有进行合理的排序和融合,导致整体推荐效果较差。
技术实现思路
本专利技术的主要目的是提出一种面向用户动态偏好的商品序列个性化推荐方法,旨在克服以上问题。为实现上述目的,本专利技术提出的一种面向用户动态偏好的商品序列个性化推荐方法,包括如下步骤:S10从用户对商品的评分信息中获取用户个人信息、商品属性信息、商品图片、同一用户对不同商品对应的评分、同一商品所受不同用户的评分、同一用户对各商品的评论文本、同一商品所受各用户的评论文本;S20根据同一商品所受不同用户的评分构造用户评分向量生成器,用以生成用户评分向量;根据同一用户对不同商品对应的评分构造商品评分向量生成器,用以生成商品评分向量;S30将同一用户对各商品的评论文本输入用户评分向量生成器生成用户评论向量,对用户评论向量进行均值聚类生成用户评论类别;将同一商品所受各用户的评论文本输入商品评分向量生成器生成商品评论向量,对商品评论向量进行均值聚类生成商品评论类别;采用深度卷积网络抽取商品的图片特征向量,对图片特征向量进行均值聚类生成图片对应的商品类别;S40将用户个人信息与用户评分向量输入用户特征抽取网络进行联合训练得到用户ID和用户评论预测类型;将商品属性信息与商品评分向量输入商品特征抽取网络进行联合训练,得到商品ID、商品评论预测类别、商品图片预测类别;S50以用户特征向量及其历史商品序列的特征向量输入商品序列推荐网络,经过其中的训练编码-解码器训练,生成以每个用户ID对应的用户特征向量,每个商品ID对应的商品特征向量,将其作为个性化推荐的商品序列,并结合搜索策略学习得到最优商品序列的推荐。优选地,所述S30包括:句子嵌入式Sent2Vec工具以中文维基百科数据为训练语料库,采用句子嵌入式Sent2Vec工具将训练语料库中每篇评论文本抽取为一维的评论向量,对所有的评论向量进行t-means聚类,得到N类用户评论类别,采用句子嵌入Sent2Vec工具对同一商品下的评论文本抽取一维的商品评论向量,对所有的商品评论向量进行t-means聚类,得到M个商品评论类别;采用深度卷积网络VGG16抽取商品图片的特征向量,对评论向量进行t-means聚类,得到I个商品图片类别。优选地,所述用户评分向量生成器所使用的用户的评分信息分为5个等组,所述用户评分向量生成器的构造方法:根据同一商品下的用户评分信息进行分组为5组,分数相同的用户在同一个组中,得到同一商品相同评分的用户组成序列<u1,u2,u3,…ux>,x取50,表示每组选取50个用户,将序列<u1,u2,u3,...,ur,…ux>作为训练样本,以用户ur作为输入,输出预测序列中除用户ur外其他用户的评分向量,使得其他用户id的概率乘积最大,若用户总数W=8000,用户评分向量生成器的损失函数y1为:得到每个用户的评分向长度为200;所述商品评分向量生成器的构造方法:将同一个用户相同评分的商品分为一组,每一组得到评分相同的商品序列<i1,i2,i3,…,ig,...,ij>,j取20,表示每组选取20个商品,将商品序列<i1,i2,i3,…,ig,...,ij>作为训练样本,以商品ig作为输入,输出预测序列中除ig外其他商品的评分向量,若商品总数R=120000,采用最大似然估计方法得到商品评分向量生成器的损失函数y2为:得到每个商品的评分向量长度为200。优选地,所述S40中所述用户特征抽取网络包括:第一卷积层,采用2个大小为3*1的卷积核,滑动步长为1的卷积层;第一用户池化层窗口大小为2*1;第二用户卷积层,采用4个大小为3*1卷积核,卷积核步长为2的卷积层;第三用户卷积层,采用5个大小为3*1的卷积核,滑动步长为1;第四用户卷积层采用10个大小为大小为5*1的卷积核,卷积核步长为2;第二用户池化层的池化层窗口大小为2*1;第五用户卷积层采用6个大小为3*1的卷积核,卷积核步长为2;第三用户池化层的窗口大小为4*1;用户全连接层的神经元数目为200,用户随机失活Dropout层,用户个人信息与用户评分向量先通过第一用户卷积层进行卷积,再采用第一用户池化层对卷积后的向量进行池化,再通过第二用户卷积层卷积后,经过批标准化进入第三用户卷积层,再次批标准化后进入第四用户卷积层卷积,第四用户卷积层输出后输入用户随机失活Dropout层,接入第二用户池化层后,再接入用户随机失活Dropout层输出,输入第五用户层卷积层,再通过第三用户池化层后输入用户全连接层,输出用户特征向量。优选地,所述用户特征向量在全连接层输出后接入到用户指数最大函数softmax层,该softmax层有8000个节点,表示系统中的8000个用户,构成的用户集合为U,将用户特征向量在全连接层输出后接入到评论指数最大函数softmax层,该softmax层有30个节点,表示30个用户评论类别,构成的用户评论类别集合为T,用户指数最大函数softmax层和评论指数最大函数softmax层均采用softmax多分类损失函数,设当前用户为ur,通过用户指数最大函数softmax层得到用户ur的预测概率为P(ur):其中sx(ur)为ur在用户指数最大函数softmax层中对应节点的输入值;当前用户的评论类别为zr,通过评论指数最大函数softmax层得到用户评论类别zr的预测概率为P(zr):其中sx(zr)为zr在评论指数最大函数softmax层中对应节点的输入值;用户特征抽取网络的总损失函本文档来自技高网...

【技术保护点】
1.一种面向用户动态偏好的商品序列个性化推荐方法,其特征在于,包括如下步骤:/nS10从用户对商品的评分信息中获取用户个人信息、商品属性信息、商品图片、同一用户对不同商品对应的评分、同一商品所受不同用户的评分、同一用户对各商品的评论文本、同一商品所受各用户的评论文本;/nS20根据同一商品所受不同用户的评分构造用户评分向量生成器,用以生成用户评分向量;根据同一用户对不同商品对应的评分构造商品评分向量生成器,用以生成商品评分向量;/nS30将同一用户对各商品的评论文本输入用户评分向量生成器生成用户评论向量,对用户评论向量进行均值聚类生成用户评论类别;将同一商品所受各用户的评论文本输入商品评分向量生成器生成商品评论向量,对商品评论向量进行均值聚类生成商品评论类别;采用深度卷积网络抽取商品的图片特征向量,对图片特征向量进行均值聚类生成图片对应的商品类别;/nS40将用户个人信息与用户评分向量输入用户特征抽取网络进行联合训练得到用户ID和用户评论预测类型;将商品属性信息与商品评分向量输入商品特征抽取网络进行联合训练,得到商品ID、商品评论预测类别、商品图片预测类别;/nS50以用户特征向量及其历史商品序列的特征向量输入商品序列推荐网络,经过其中的训练编码-解码器训练,生成以每个用户ID对应的用户特征向量,每个商品ID对应的商品特征向量,将其作为个性化推荐的商品序列,并结合搜索策略学习得到最优商品序列的推荐。/n...

【技术特征摘要】
1.一种面向用户动态偏好的商品序列个性化推荐方法,其特征在于,包括如下步骤:
S10从用户对商品的评分信息中获取用户个人信息、商品属性信息、商品图片、同一用户对不同商品对应的评分、同一商品所受不同用户的评分、同一用户对各商品的评论文本、同一商品所受各用户的评论文本;
S20根据同一商品所受不同用户的评分构造用户评分向量生成器,用以生成用户评分向量;根据同一用户对不同商品对应的评分构造商品评分向量生成器,用以生成商品评分向量;
S30将同一用户对各商品的评论文本输入用户评分向量生成器生成用户评论向量,对用户评论向量进行均值聚类生成用户评论类别;将同一商品所受各用户的评论文本输入商品评分向量生成器生成商品评论向量,对商品评论向量进行均值聚类生成商品评论类别;采用深度卷积网络抽取商品的图片特征向量,对图片特征向量进行均值聚类生成图片对应的商品类别;
S40将用户个人信息与用户评分向量输入用户特征抽取网络进行联合训练得到用户ID和用户评论预测类型;将商品属性信息与商品评分向量输入商品特征抽取网络进行联合训练,得到商品ID、商品评论预测类别、商品图片预测类别;
S50以用户特征向量及其历史商品序列的特征向量输入商品序列推荐网络,经过其中的训练编码-解码器训练,生成以每个用户ID对应的用户特征向量,每个商品ID对应的商品特征向量,将其作为个性化推荐的商品序列,并结合搜索策略学习得到最优商品序列的推荐。


2.如权利要求1所述的面向用户动态偏好的商品序列个性化推荐方法,其特征在于,所述S30包括:
句子嵌入式Sent2Vec工具以中文维基百科数据为训练语料库,采用句子嵌入式Sent2Vec工具将训练语料库中每篇评论文本抽取为一维的评论向量,对所有的评论向量进行t-means聚类,得到N类用户评论类别,采用句子嵌入Sent2Vec工具对同一商品下的评论文本抽取一维的商品评论向量,对所有的商品评论向量进行t-means聚类,得到M个商品评论类别;采用深度卷积网络VGG16抽取商品图片的特征向量,对评论向量进行t-means聚类,得到I个商品图片类别。


3.如权利要求1所述的面向用户动态偏好的商品序列个性化推荐方法,其特征在于,所述用户评分向量生成器所使用的用户的评分信息分为5个等组,所述用户评分向量生成器的构造方法:
根据同一商品下的用户评分信息进行分组为5组,分数相同的用户在同一个组中,得到同一商品相同评分的用户组成序列<u1,u2,u3,…ux>,x取50,表示每组选取50个用户,将序列<u1,u2,u3,...,ur,…ux>作为训练样本,以用户ur作为输入,输出预测序列中除用户ur外其他用户的评分向量,使得其他用户id的概率乘积最大,若用户总数W=8000,用户评分向量生成器的损失函数y1为:



得到每个用户的评分向长度为200;
所述商品评分向量生成器的构造方法:
将同一个用户相同评分的商品分为一组,每一组得到评分相同的商品序列<i1,i2,i3,…,ig,...,ij>,j取20,表示每组选取20个商品,将商品序列<i1,i2,i3,…,ig,...,ij>作为训练样本,以商品ig作为输入,输出预测序列中除ig外其他商品的评分向量,若商品总数R=120000,采用最大似然估计方法得到商品评分向量生成器的损失函数y2为:



得到每个商品的评分向量长度为200。


4.如权利要求2所述的面向用户动态偏好的商品序列个性化推荐方法,其特征在于,所述S40中所述用户特征抽取网络包括:
第一卷积层,采用2个大小为3*1的卷积核,滑动步长为1的卷积层;
第一用户池化层窗口大小为2*1;
第二用户卷积层,采用4个大小为3*1卷积核,卷积核步长为2的卷积层;第三用户卷积层,采用5个大小为3*1的卷积核,滑动步长为1;
第四用户卷积层采用10个大小为大小为5*1的卷积核,卷积核步长为2;
第二用户池化层的池化层窗口大小为2*1;
第五用户卷积层采用6个大小为3*1的卷积核,卷积核步长为2;
第三用户池化层的窗口大小为4*1;
用户全连接层的神经元数目为200,
用户随机失活Dropout层,
用户个人信息与用户评分向量先通过第一用户卷积层进行卷积,再采用第一用户池化层对卷积后的向量进行池化,再通过第二用户卷积层卷积后,经过批标准化进入第三用户卷积层,再次批标准化后进入第四用户卷积层卷积,第四用户卷积层输出后输入用户随机失活Dropout层,接入第二用户池化层后,再接入用户随机失活Dropout层输出,输入第五用户层卷积层,再通过第三用户池化层后输入用户全连接层,输出用户特征向量。


5.如权利要求4所述的面向用户动态偏好的商品序列个性化推荐方法,其特征在于,所述用户特征向量在全连接层输出后接入到用户指数最大函数softmax层,该softmax层有8000个节点,表示系统中的8000个用户,构成的用户集合为U,将用户特征向量在全连接层输出后接入到评论指数最大函数softmax层,该softmax层有30个节点,表示30个用户评论类别,构成的用户评论类别集合为T,用户指数最大函数softmax层和评论指数最大函数softmax层均采用softmax多分类损失函数,
设当前用户为ur,通过用户指数最大函数softmax层得到用户ur的预测概率为P(ur):



其中sx(ur)为ur在用户指数最大函数softmax层中对应节点的输入值;
当前用户的评论类别为zr,通过评论指数最大函数softmax层得到用户评论类别zr的预测概率为P(zr):



其中sx(zr)为zr在评论指数最大函数softmax层中对应节点的输入值;
用户特征抽取网络的总损失函数为:



其中η为L1的调节系数,取值在0.7-0.8之间。


6.如权利要求1所述的面向用户动态偏好的商品序列个性化推荐方法,其特征在于,所述用户个人信息至少包括以下9种属性:用户年龄、用户性别、用户职业、所在地区、平均评分、购买量、平均浏览时间、收藏量以及平均购买金额,每种属性分别用独热向量表示,然后拼接所有属性成一个长向量,并将这长向经过五层自编码器工具降维成成长度为50的向量;所述商品属性信息至少包括以下9种属性:每日订单...

【专利技术属性】
技术研发人员:黄震华汤庸刘海李丁丁蔡立群廖晓鹏
申请(专利权)人:华南师范大学广东智信信息科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1