一种基于文本UGC的混合神经网络跨领域推荐方法技术

技术编号:22689009 阅读:25 留言:0更新日期:2019-11-30 03:37
本发明专利技术公开了一种基于文本UGC的混合神经网络跨领域推荐方法,目标域特征提取模块根据用户和物品ID为用户和物品分别构建隐因子嵌入矩阵,得到目标域用户、物品的特征向量;所述的辅助域物品特征迁移模块通过模拟类因子分解机模型将用户在两域的特征进行对应位置相乘的交互运算,从而得到两域物品间的关联特征向量,将该向量与目标域用户、物品特征向量在模型顶层进行连接,得到最终的用户‑物品联合特征向量;最后进行Top N物品推荐。本发明专利技术为端到端的深度学习跨领域推荐方法,同时自动、高效地利用两域文本UGC,通过深度学习方法挖掘两域物品间的关联特征,可有效提高目标域的物品推荐精度及缓解数据稀疏和冷启动问题。

A cross domain recommendation method of hybrid neural network based on text UGC

The invention discloses a hybrid neural network cross domain recommendation method based on text UGC. The target domain feature extraction module constructs hidden factor embedding matrix for users and items respectively according to user and item ID to obtain the feature vectors of users and items in the target domain. The auxiliary domain item feature migration module simulates the features of users in the two domains by simulating the class factor decomposition machine model The interactive operation of the corresponding position multiplication can get the associated eigenvector between the items in the two domains. The vector is connected with the user and item eigenvector in the target domain at the top of the model to get the final user \u2011 item joint eigenvector. Finally, the top n item recommendation is carried out. The invention is an end-to-end deep learning cross domain recommendation method, and at the same time automatically and efficiently utilizes the two domain text UGC to mine the association features between the two domain items through the deep learning method, which can effectively improve the item recommendation accuracy of the target domain and alleviate the problem of data sparsity and cold start.

【技术实现步骤摘要】
一种基于文本UGC的混合神经网络跨领域推荐方法
本专利技术涉及推荐系统
,尤其涉及一种基于文本UGC的混合神经网络跨领域推荐方法。
技术介绍
随着移动互联网技术的发展,网络信息数量爆炸式增长,信息过载现象日益严重。杂乱繁多的网络内容使得信息的高效组织变得困难与复杂,信息利用效率大大下降。信息接收者难以从海量信息中找到满意的内容,信息发布者同样面临着如何从海量的信息中挑选出让消费者满意的信息的困扰。推荐系统在这种情况下应运而生,它能有效缓解信息过载问题。推荐系统利用用户-物品的交互信息为用户推荐物品为不需要用户自行选择与操作,有效提高了信息的利用效率。推荐系统的核心为推荐算法,传统的协同过滤算法是推荐系统领域应用最广泛的算法,但其一直受到数据稀疏和冷启动问题的困扰。近来,跨领域推荐方法受到越来越多的研究者重视,该方法与传统的推荐方式相比,可以利用的用户-物品交互数据不仅来自单一的领域,而可以是两个甚至是多个,因此对于数据稀疏和冷启动问题有很好的缓解能力。当今网络购物平台销售物品种类繁多,涉及日用、服饰、食品、书籍、电子产品等各个领域。这些不同领域物品的特征存在一定的相关性,正是这种特征的相关性使得用户在不同领域的购买行为表现出一定的规律。通过跨领域的推荐算法将跨领域物品间的关联特征充分挖掘,用于目标物品的推荐,该方法可有效提高推荐精度并缓解当前推荐方法存在的数据稀疏和冷启动问题。UGC(UserGeneratedContent)即用户生成内容,兴起于web2.0时代,是一种使用互联网的新方式,用户既是互联网资源的使用者也是生产者。UGC蕴含丰富的用户、物品特征信息,将其运用于跨领域推荐系统的构建对于web2.0时代下新型推荐系统的发展具有较大意义。然而目前跨领域推荐系统对于UGC特别是文本UGC的利用较少,对于文本的处理也大多采用传统的聚类方法、LDA主题模型等,面对海量、复杂的数据时,这些方法存在效率低、数据利用不充分、需要人为干预等问题,从而导致推荐效果不佳。
技术实现思路
本专利技术目的就是为了弥补已有技术的缺陷,提供基于文本UGC的混合神经网络跨领域推荐方法,该推荐方法可以合理、高效实用文本UGC,提高目标域的物品推荐精度及性能。本专利技术是通过以下技术方案实现的:一种基于文本UGC的混合神经网络跨领域推荐方法,包括有目标域特征提取模块以及辅助域物品特征迁移模块;所述的目标域特征提取模块由协同过滤神经网络构成,根据用户和物品ID为用户和物品分别构建隐因子嵌入矩阵,经过多层特征映射得到目标域用户、物品特征向量,作为最终的目标用户、物品联合特征向量一部分;所述的辅助域物品特征迁移模块是本方法的核心,将目标域和辅助域的文本UGC作为物品特征迁移的桥梁,通过模拟类因子分解机模型将两域的文本UGC特征向量进行对应位置相乘的交互运算,从而得到两域物品间的关联特征向量,将该向量与目标域用户、物品特征向量在模型顶层进行连接,得到最终的用户、物品联合特征向量;最后经过softmax分类函数,得到目标用户对物品喜好程度的预测,进而进行TopN物品推荐,交叉熵损失函数作为最终预测值的目标函数,利用梯度下降法优化模型参数。所述的目标域特征提取模块具体的工作步骤如下:输入:目标域用户物品ID、用户-物品评分矩阵R;输出:目标域用户、物品特征向量Tui;(1)用户在目标域、辅助域数据的获取:通过用户的唯一ID对用户身份进行识别,得到用户u在目标域、辅助域中与物品的交互信息,包括目标域中的文本UGCdi,辅助域中的文本UGC集DS,目标域用户-物品评分矩阵R,其中评分矩阵R作为用户对物品喜好程度的判断依据,文本UGC则作为联系用户在两个领域间兴趣偏好的信息桥梁;(2)目标域用户、物品特征提取:将用户、物品ID进行one-hot编码处理:vu∈{0,1}m(1)vi∈{0,1}n(2)其中,vu和vi分别代表用户和物品one-hot向量,向量中对应索引位置值为1,其余都为0,m和n分别为目标域用户、物品数量。用户、物品one-hot向量通过协同过滤神经网络的处理得到目标域用户和物品的隐性特征向量xu和xi,将二者进行拼接处理得目标域用户、物品特征的合向量xui:xui=[xu,xi](3)所述的辅助域物品特征迁移模块具体的工作步骤如下:1)目标域文本UGC特征提取:目标域文本UGCdi表示目标域中用户u对物品i的评论文本,对di使用预训练的词嵌入模型word2vec进行向量化处理,再经过特征映射和特征提取,得到目标域文本UGC特征向量,该向量作为特征交互层的一个输入;2)辅助域文本UGC特征提取:辅助域中与目标用户u产生过交互的物品数量较多,因此用户u与多个物品交互可产生文本UGC集Ds,Ds中的元素dj表示辅助域中用户u在辅助域中对物品j的评论文本,采用步骤1)中所述的方法对Ds中的元素逐个进行处理,以得到辅助域中文本UGC特征向量集,该向量集中的向量作为特征交互集的另一个输入;3)跨领域物品特征交互计算:不同领域中物品的特征之间存在一定的相关性,比如电影和书籍二者之间的联系可以体现在文体或风格上。相比较这种明显的关联特征,大部分的特征通常是隐性的、不直观的。通过模拟类因子分解机模型,在用户、物品的特征提取层上方增加一个特征交互层,该特征交互层分别将目标域文本UGC特征向量和辅助域文本UGC特征向量集中的单个向量作为输入,对两个特征向量中对应位置的元素进行乘积运算,以求得特征交互向量:其中,为目标域中用户u对物品i的评论文本的特征向量,为辅助域中用户u对物品j的评论文本的特征向量,s为用户u在辅助域中的文本UGC数量;经过迭代计算,得到两域的文本UGC特征交互向量集,该特征交互集中的向量经过求和运算得到最终的跨领域物品特征交互向量:其中,s为用户u在辅助域中的文本UGC数量;4)目标域与辅助域物品特征融合:经过前面步骤的处理,目标域中的用户、物品特征向量以及目标域物品和辅助域物品的特征交互向量都已确定,分别通过记忆矩阵W和迁移矩阵N将目标域中的用户、物品特征向量以及辅助域物品迁移特征向量融合,得到最终的目标用户、物品特征向量yui:yui=MTTui+NTSuj(6)其中,M为目标域记忆矩阵,用来控制目标域用户、物品特征的保留程度,N为迁移矩阵,用来决定辅助域物品特征的迁移内容,二者的组合为最终的目标用户-物品联合特征向量;其中Tui为目标域用户、物品特征向量,Suj为辅助域物品可迁移特征向量;5)用户对目标域物品的喜好程度预测:最终的目标用户、物品联合特征向量yui进过softmax层后得到目标用户对物品的喜好程度值最后,基于值进行TopN物品推荐。在本算法中,目标域用户、物品特征提取模块为主要部分,负责目标用户和物品之间交互关系的特征提取,该特征作为判断目标用户对物品喜好的主要依据。辅助域物品特本文档来自技高网
...

【技术保护点】
1.一种基于文本UGC的混合神经网络跨领域推荐方法,文本UGC为用户对物品的评论文本,其特征在于:包括有目标域特征提取模块以及辅助域物品特征迁移模块;/n所述的目标域特征提取模块由协同过滤神经网络构成,根据用户和物品ID为用户和物品分别构建隐因子嵌入矩阵,经过多层特征映射得到目标域用户、物品特征向量T

【技术特征摘要】
1.一种基于文本UGC的混合神经网络跨领域推荐方法,文本UGC为用户对物品的评论文本,其特征在于:包括有目标域特征提取模块以及辅助域物品特征迁移模块;
所述的目标域特征提取模块由协同过滤神经网络构成,根据用户和物品ID为用户和物品分别构建隐因子嵌入矩阵,经过多层特征映射得到目标域用户、物品特征向量Tui;
所述的辅助域物品特征迁移模块将目标域和辅助域的文本UGC作为物品特征迁移的桥梁,通过模拟类因子分解机模型将两域物品特征进行对应位置相乘的交互运算,得到辅助域物品可迁移的特征向量Suj,将辅助域物品可迁移的特征向量Suj与目标域用户、物品特征向量Tui在模型顶层进行连接,得到最终的用户、物品联合特征向量yui;最后经过softmax分类函数,得到目标用户对物品喜好程度的预测,进而进行TopN物品推荐,交叉熵损失函数作为最终预测值的目标函数,利用梯度下降法优化模型参数。


2.根据权利要求1所述的一种基于文本UGC的混合神经网络跨领域推荐方法,其特征在于:所述的目标域特征提取模块具体的工作步骤如下:
输入:目标域用户物品ID、用户-物品评分矩阵R;
输出:目标域用户、物品特征向量Tui;
(1)用户在目标域、辅助域数据的获取:通过用户的唯一ID对用户身份进行识别,得到用户u在目标域、辅助域中与物品的交互信息,包括目标域中的文本UGCdi,辅助域中的文本UGC集DS,目标域用户-物品评分矩阵R,其中评分矩阵R作为用户对物品喜好程度的判断依据,文本UGC则作为联系用户在两个领域间兴趣偏好的信息桥梁;
(2)目标域用户、物品特征提取:将用户、物品ID进行one-hot编码处理:
vu∈{0,1}m(1)
vi∈{0,1}n(2)
其中,vu和vi分别代表用户u和物品i的one-hot向量,向量中对应索引位置值为1,其余都为0,m和n分别为目标域用户、物品数量;
用户、物品one-hot向量通过协同过滤神经网络的处理得到目标域用户和物品的隐性特征向量xu和xi,将二者进行拼接处理得目标域用户、物品特征的合向量xui:
xui=[xu,xi](3)


3.根据权利要求2所述的一种基于文本UGC的混合神经网络跨领域推荐方法,其特征在于:所述的辅助域物品特征迁移模块具体的工...

【专利技术属性】
技术研发人员:吴国栋陶鸿查志康王静雅陈海涵涂立静
申请(专利权)人:安徽农业大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1