一种基于文本UGC的混合神经网络跨领域推荐方法技术

技术编号：22689009 阅读：25 留言：0更新日期：2019-11-30 03:37

本发明专利技术公开了一种基于文本UGC的混合神经网络跨领域推荐方法，目标域特征提取模块根据用户和物品ID为用户和物品分别构建隐因子嵌入矩阵，得到目标域用户、物品的特征向量；所述的辅助域物品特征迁移模块通过模拟类因子分解机模型将用户在两域的特征进行对应位置相乘的交互运算，从而得到两域物品间的关联特征向量，将该向量与目标域用户、物品特征向量在模型顶层进行连接，得到最终的用户‑物品联合特征向量；最后进行Top N物品推荐。本发明专利技术为端到端的深度学习跨领域推荐方法，同时自动、高效地利用两域文本UGC，通过深度学习方法挖掘两域物品间的关联特征，可有效提高目标域的物品推荐精度及缓解数据稀疏和冷启动问题。

A cross domain recommendation method of hybrid neural network based on text UGC

The invention discloses a hybrid neural network cross domain recommendation method based on text UGC. The target domain feature extraction module constructs hidden factor embedding matrix for users and items respectively according to user and item ID to obtain the feature vectors of users and items in the target domain. The auxiliary domain item feature migration module simulates the features of users in the two domains by simulating the class factor decomposition machine model The interactive operation of the corresponding position multiplication can get the associated eigenvector between the items in the two domains. The vector is connected with the user and item eigenvector in the target domain at the top of the model to get the final user \u2011 item joint eigenvector. Finally, the top n item recommendation is carried out. The invention is an end-to-end deep learning cross domain recommendation method, and at the same time automatically and efficiently utilizes the two domain text UGC to mine the association features between the two domain items through the deep learning method, which can effectively improve the item recommendation accuracy of the target domain and alleviate the problem of data sparsity and cold start.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于文本UGC的混合神经网络跨领域推荐方法
本专利技术涉及推荐系统
，尤其涉及一种基于文本UGC的混合神经网络跨领域推荐方法。
技术介绍
随着移动互联网技术的发展，网络信息数量爆炸式增长，信息过载现象日益严重。杂乱繁多的网络内容使得信息的高效组织变得困难与复杂，信息利用效率大大下降。信息接收者难以从海量信息中找到满意的内容，信息发布者同样面临着如何从海量的信息中挑选出让消费者满意的信息的困扰。推荐系统在这种情况下应运而生，它能有效缓解信息过载问题。推荐系统利用用户-物品的交互信息为用户推荐物品为不需要用户自行选择与操作，有效提高了信息的利用效率。推荐系统的核心为推荐算法，传统的协同过滤算法是推荐系统领域应用最广泛的算法，但其一直受到数据稀疏和冷启动问题的困扰。近来，跨领域推荐方法受到越来越多的研究者重视，该方法与传统的推荐方式相比，可以利用的用户-物品交互数据不仅来自单一的领域，而可以是两个甚至是多个，因此对于数据稀疏和冷启动问题有很好的缓解能力。当今网络购物平台销售物品种类繁多，涉及日用、服饰、食品、书籍、电子产品等各个领域。这些不同领域物品的特征存在一定的相关性，正是这种特征的相关性使得用户在不同领域的购买行为表现出一定的规律。通过跨领域的推荐算法将跨领域物品间的关联特征充分挖掘，用于目标物品的推荐，该方法可有效提高推荐精度并缓解当前推荐方法存在的数据稀疏和冷启动问题。UGC(UserGeneratedContent)即用户生成内容，兴起于web2.0时代，是一种使用互联网的新方式，用户...

【技术保护点】
1.一种基于文本UGC的混合神经网络跨领域推荐方法，文本UGC为用户对物品的评论文本，其特征在于：包括有目标域特征提取模块以及辅助域物品特征迁移模块；/n所述的目标域特征提取模块由协同过滤神经网络构成，根据用户和物品ID为用户和物品分别构建隐因子嵌入矩阵，经过多层特征映射得到目标域用户、物品特征向量T

【技术特征摘要】
1.一种基于文本UGC的混合神经网络跨领域推荐方法，文本UGC为用户对物品的评论文本，其特征在于：包括有目标域特征提取模块以及辅助域物品特征迁移模块；
所述的目标域特征提取模块由协同过滤神经网络构成，根据用户和物品ID为用户和物品分别构建隐因子嵌入矩阵，经过多层特征映射得到目标域用户、物品特征向量Tui；
所述的辅助域物品特征迁移模块将目标域和辅助域的文本UGC作为物品特征迁移的桥梁，通过模拟类因子分解机模型将两域物品特征进行对应位置相乘的交互运算，得到辅助域物品可迁移的特征向量Suj，将辅助域物品可迁移的特征向量Suj与目标域用户、物品特征向量Tui在模型顶层进行连接，得到最终的用户、物品联合特征向量yui；最后经过softmax分类函数，得到目标用户对物品喜好程度的预测，进而进行TopN物品推荐，交叉熵损失函数作为最终预测值的目标函数，利用梯度下降法优化模型参数。

2.根据权利要求1所述的一种基于文本UGC的混合神经网络跨领域推荐方法，其特征在于：所述的目标域特征提取模块具体的工作步骤如下：
输入：目标域用户物品ID、用户-物品评分矩阵R；
输出：目标域用户、物品特征向量Tui；
(1)用户在目标域、辅助域数据的获取：通过用户的唯一ID对用户身份进行识别，得到用户u在目标域、辅助域中与物品的交互信息，包括目标域中的文本UGCdi，辅助域中的文本UGC集DS，目标域用户-物品评分矩阵R，其中评分矩阵R作为用户对物品喜好程度的判断依据，文本UGC则作为联系用户在两个领域间兴趣偏好的信息桥梁；
(2)目标域用户、物品特征提取：将用户、物品ID进行one-hot编码处理：
vu∈{0,1}m(1)
vi∈{0,1}n(2)
其中，vu和vi分别代表用户u和物品i的one-hot向量，向量中对应索引位置值为1，其余都为0，m和n分别为目标域用户、物品数量；
用户、物品one-hot向量通过协同过滤神经网络的处理得到目标域用户和物品的隐性特征向量xu和xi，将二者进行拼接处理得目标域用户、物品特征的合向量xui：
xui＝[xu,xi](3)

3.根据权利要求2所述的一种基于文本UGC的混合神经网络跨领域推荐方法，其特征在于：所述的辅助域物品特征迁移模块具体的工...

【专利技术属性】
技术研发人员：吴国栋，陶鸿，查志康，王静雅，陈海涵，涂立静，
申请(专利权)人：安徽农业大学，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人