一种基于用户兴趣建模的新闻推荐方法技术

技术编号：35988668 阅读：16 留言：0更新日期：2022-12-17 23:03

本发明专利技术公开了一种基于用户兴趣建模的个性化新闻推荐方法，包括步骤：获得新闻文本数据，将文本数据进行预处理，删除停用词，向量化等操作；将向量化的新闻数据输送到文本特征提取器进行特征抽取，获得新闻特征；构建基于用户兴趣的新闻推荐模型，结合残差图卷积网络模块与用户热兴趣模块，输出用户点击概率；模型训练，模型训练基于交叉熵损失函数进行训练；对输入的一系列候选新闻的点击预测概率进行排序，输出设定好的前K篇新闻作为推荐结果。本发明专利技术用于用户个性化的新闻推荐，能有效提升推荐有效性。荐有效性。荐有效性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于用户兴趣建模的新闻推荐方法

[0001]本专利技术涉及新闻推荐领域，具体涉及一种基于用户阅读偏好的深度学习新闻推荐方法。

技术介绍

[0002]个性化推荐系统利用用户的行为(如搜索历史记录、阅读记录等)为该用户生成推荐列表。传统的新闻推挤方法大抵可分为基于内容的过滤方法和基于协同过滤的方法。两类方法虽然可以在一定程度上实现新闻推荐的功能，但是这两类方法都存在一定的缺陷，实际推荐效果不佳，难以满足实际使用需求。
[0003]基于内容的算法在最初是最流行、最高效的方法，因此在任何推荐系统开始时被广泛应用。在基于内容过滤的推荐方法中，通过分析用户过去感兴趣的新闻的属性，推荐用户某些未读过的新闻。这些系统不关心用户对这些项目的评分。在基于内容的算法中，相似度计算方法直接影响推荐结果的准确性。有几种被广泛使用的相似性计算方法：
①
欧几里德距离：通过计算两个向量中每个元素的平方距离之和来衡量两个向量之间相似性的最常用方法之一。
②
余弦：该方法的主要思想是通过计算两个向量之间的夹角余弦来测量两个向量。
③
Pearson：Pearson相关系数反映两个向量之间的线性相关程度。
④
Jaccard：Jaccard相似度通常用于比较两个有限样本集之间的相似性和差异。与其他协同过滤系统相比，基于内容的推荐系统有很多好处，例如：用户独立性、透明度、冷启动问题时的新项目。但是基于内容的方法还存在一些不足之处，如分析内容有限、过于专业化或缺乏新用户的评分数据，...

【技术保护点】

【技术特征摘要】
1.一种基于用户兴趣建模的新闻推荐方法，其特征在于，包括以下步骤：步骤1、根据所需的新闻属性信息进行预处理得到新闻数据构造新闻数据集；用于训练的新闻数据集中，用户与新闻之间存在交互则标记为正样本，表示用户阅读过该新闻，否则标记为负样本；步骤2、新闻推荐模型的构建与训练：利用新闻数据集中的训练数据对所述新闻推荐模型进行深度学习训练，当满足预置的停止训练条件时，得到训练好的新闻推荐网络模型；所述新闻推荐网络模型用于，输出用户点击候选新闻的概率，包括特征提取模块、残差图卷积网络GCN、用户热兴趣模块和全连接神经网络；特征提取模块包括点击序列特征提取器和新闻文本特征提取器，分别用于提取用户近期点击序列特征和新闻文本特征；残差GCN用于接收新闻文本特征输出新闻嵌入以及用户长期兴趣特征；用户热兴趣模块用于接收用户近期点击序列特征输出用户热兴趣特征；全连接神经网络用于将用户长期兴趣特征与用户热兴趣特征进行...

【专利技术属性】
技术研发人员：许毅，赵太银，解修蕊，罗光春，赵航，张博闻，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人