基于用户全局兴趣迁移感知的个性化新闻推荐方法及系统技术方案

技术编号：35997604 阅读：26 留言：0更新日期：2022-12-17 23:14

本发明专利技术公开了一种基于用户全局兴趣迁移感知的个性化新闻推荐方法及系统，该方法首先从新闻数据中提取新闻标题文本和新闻标题实体文本，并构建用户序列、用户和新闻之间的点击关系网络以及新闻与新闻的顺序关系网络；再进行多视角关联的新闻内容表征计算；之后计算用户内容兴趣表征；接着构建新闻的全局迁移图，卷积用户和新闻间的点击关系以及新闻与新闻间的迁移关系，然后融合得到的两种关系得到用户的迁移兴趣表征；最后，联合用户的内容兴趣表征和迁移兴趣表征，构建最终的用户全局兴趣迁移感知的新闻推荐模型，实现个性化推荐。系统采用web交互技术实现数据分析和推荐结果的可视化展示。本发明专利技术可以有效提高个性化推荐的准确性，鲁棒性强。鲁棒性强。鲁棒性强。

全部详细技术资料下载

【技术实现步骤摘要】
基于用户全局兴趣迁移感知的个性化新闻推荐方法及系统

[0001]本专利技术涉及个性化新闻推荐方法，特别是涉及基于用户全局兴趣迁移感知的个性化新闻推荐方法及系统。

技术介绍

[0002]在线新闻平台的飞速发展使得用户能够通过在线新闻平台及时分享、搜索及浏览新闻信息，这极大地丰富了人们的信息需求，也带来了信息过载问题。推荐系统利用信息过滤技术向用户推荐其可能感兴趣的信息，成为解决信息过载问题的有效方案。
[0003]新闻推荐系统大致可以分为基于协同过滤的新闻推荐和基于内容的新闻推荐两类方法。在基于协同过滤方式和基于内容方式的基础上，又衍生出很多新的分支，依据其针对的问题，主要分为隐私保护的推荐系统、知识感知的推荐系统、序列感知的推荐系统和可解释的推荐系统。新闻由于具有匿名浏览的特殊性，通常以会话序列的形式存储用户的浏览记录，难以得到用户长期的浏览信息，因此，在新闻推荐中基于序列推荐的重要性尤为显著。Wang等研究者在2019年系统地总结了序列推荐系统的分类，序列推荐系统按照发展的技术路线主要分为三类：传统序列推荐系统、基于隐语义模型的序列推荐系统和基于深度学习的推荐系统。
[0004]传统序列推荐主要分为基于序列模式挖掘的序列推荐模型和基于马尔科夫链模型的序列推荐模型。基于序列模式挖掘的方法主要是从序列数据中挖掘出一些频繁模式，然后利用挖掘出的模式指导后续的推荐。序列模式挖掘虽然简单直接，但通常会产生大量的冗余模式，增加了不必要的时间和空间开销。另一个明显的缺点是，由于频率约束，它经常丢失那些不经常出现的...

【技术保护点】

【技术特征摘要】
1.一种基于用户全局兴趣迁移感知的个性化新闻推荐方法，其特征在于，该方法包括以下步骤：(1)对用户历史浏览新闻和候选新闻进行数据预处理，构建全局的新闻与新闻的顺序关系网络以及用户和新闻之间的点击关系网络；(2)候选新闻内容表征计算使用注意力机制分别从文本视角和实体视角两个不同的视角对候选新闻进行标题文本与实体的自注意表征计算，并计算两个视角表征的交叉注意表征，结合两个视角各自的表征和两个视角之间的交叉注意表征，进行多视角融合计算获得候选新闻内容表征；(3)用户内容兴趣表征计算使用注意力机制分别从文本视角和实体视角两个不同的视角对用户历史浏览新闻进行标题文本与实体的自注意表征计算，并计算两个视角表征的交叉注意表征，结合两个视角各自的表征和两个视角之间的交叉注意表征，进行多视角融合计算，获得用户历史浏览新闻内容表征，然后基于注意力机制聚合用户历史浏览新闻内容表征，得到用户内容兴趣的表征；(4)用户迁移兴趣表征计算融合步骤(1)中构建的全局的新闻与新闻的顺序关系网络以及用户和新闻之间的点击关系网络，构建全局新闻迁移图，将全局新闻迁移图中用户节点表征和不同的邻居新闻节点表征作为输入，使用两层迁移感知的图注意网络来进行信息聚合和学习，最后得到用户迁移兴趣表征、新闻表征、迁移表征，所述迁移表征包括传播表征和影响表征；(5)联合推荐模型结合步骤(2)得到的候选新闻内容表征、步骤(3)得到的用户内容兴趣表征、步骤(4)得到的用户迁移兴趣表征、新闻表征、迁移表征，构建联合推荐模块并进行新闻推荐，对步骤(3)得到的用户内容兴趣表征与步骤(2)得到的候选新闻内容表征进行相似度计算，得到用户内容兴趣评分，对用户迁移兴趣表征与候选新闻表征、迁移表征进行相似度计算得到用户迁移兴趣评分；将用户内容兴趣评分和用户迁移兴趣评分进行加权求和，得到最终用户对候选新闻的交互概率，最后依据交互概率的排序返回候选新闻集合中推荐的top
‑
k新闻列表；(6)系统功能展示。2.根据权利要求1所述的基于用户全局兴趣迁移感知的个性化新闻推荐方法，其特征在于，步骤(1)的具体方法是，从用户历史浏览新闻和候选新闻中提取新闻标题文本字段以及标题实体字段，分别通过Glove词向量和维基百科上训练的实体向量获取对应的新闻标题词向量和实体向量作为初始向量表示；按照用户浏览新闻的时间顺序构建每个用户历史浏览新闻序列，同时构建用户和历史浏览新闻之间的点击关系网络，然后根据用户的历史浏览新闻的序列数据，将点击前后的历史浏览新闻之间连边，构建全局的新闻与新闻的顺序关系网络。3.根据权利要求1所述的基于用户全局兴趣迁移感知的个性化新闻推荐方法，其特征在于，步骤(2)包括如下具体步骤：(2
‑
1)对于给定候选新闻n
i
，新闻的标题文本序列表示为其
中T
i
表示第i条新闻的标题文本，w
i,j
即为第i条新闻的标题文本中的第j个单词，|T
i
|为标题文本中单词的总数；新闻的实体序列表示为其中E
i
表示第i条新闻的标题实体，e
i,j
即为第i条新闻的标题中的第j个实体，|E
i
|即为标题中实体的总数；利用自注意力学习新闻的标题文本序列表征矩阵其计算过程如下：程如下：程如下：其中，为单词序列的词向量矩阵，上标T表示矩阵转置操作，d
w
是单词的特征维度，表示单词w
i,j
的向量表示，表示新闻n
i
中第j个单词的自注意力影响权重，exp(
·
)表示以自然常数e为底的指数函数，是新闻n
i
中第j个单词的自注意力表征权重，k是指第k个单词，是单词的自注意力表征，将每个单词依据归一化权重向量进行更新得到文本序列表征矩阵之后，利用自注意力机制计算第i条新闻标题文本自注意表示对于标题中的实体也进行自注意力学习实体序列表示，得到新闻标题的实体序列表征矩阵其中表示第i个新闻的标题中的第j个实体的自注意力表征，以及得到新闻标题中的实体自注意表示(2
‑
2)通过对新闻的标题文本序列表征矩阵和新闻的实体序列表示进行交叉注意得到单词与实体两两之间的关联程度，分别加和行、列作为单词和实体的权重值，再通过加权分别聚合文本集合和实体集合特征得到文本层面交叉学习表示和实体层面交叉学习表示的具体计算过程如下：的具体计算过程如下：的具体计算过程如下：其中表示单词w
i,j
的自注意向量表示，表示实体e
i,k
的自注意向量表
示，表示新闻n
i
中的第j个单词的交叉注意力表征权重，表示新闻n
i
中的第j个单词的交叉注意力影响权重，表示新闻n
i
中的第k个单词的交叉注意力影响权重，表示新闻n
i
中的第k个单词的交叉注意力表征权重，d
w
和d
e
分别是单词和实体特征维度，实体层面交叉学习表示的计算方法同文本层面交叉学习表示(2
‑
3)通过将步骤(2
‑
1)得到的标题文本自注意表示标题实体自注意表示以及步骤(2
‑
2)得到的文本层面交叉学习表示和实体层面交叉学习表示进行相加后进行拼接得到新闻内容表征向量，第i条新闻的多视角表征向量计算如下：其中+表示两个向量对位相加，||表示拼接操作，第i条新闻内容表征向量计算如下：其中是线性层权重，是线性层偏差。4.根据权利要求1所述的基于用户全局兴趣迁移感知的个性化新闻推荐方法，其特征在于，步骤(3)包括如下具体步骤：(3
‑
1)进行用户序列内容自注意力提取，通过对用户历史浏览新闻序列进行新闻内容表征计算得到新闻序列矩阵其中作为用户u
i
浏览的第一条新闻n1的内容表征向量，代表该用户历史浏览序列的长度，将自注意力机制应用在新闻序列向量集合构建的矩阵上更新新闻序列之间的信息得到新闻自注意力矩阵再通过的Softmax函数进行归一化得到权重矩阵然后将这个权重矩阵与对应的新闻向量集合相乘实现每个新闻与其他新闻之间联系，得到用户历史浏览新闻的自注意力向量矩阵其中是用户u
i
对新闻n
j
的自注意力向量；(3
‑
2)从用户层面使用注意力机制去加权聚合新闻的自注意力向量集合以表征用户的内容兴趣偏好计算如下：计算如下：其中表示用户u
i
对历史浏览序列中的新闻n
j
的偏好程度，是第一层线性层的参数，其维数与新闻内容向量的维数的大小一致，通过Tanh激活函数进行非线性变化后送入第二层线性层；则为第二层线性层的参数，用户实现将维数d
n
映射为1，由此每一个新闻向量则对应了一个权值，将所有历史浏览新闻权值进行归一化后即可得到用户对历史浏览新闻序列中的新闻的偏好分布情况，最后通过加权求和新闻自注意力
向量矩阵得到用户内容兴趣表示5.根据权利要求1所述的基于用户全局兴趣迁移感知的个性化新闻推荐方法，其特征在于，步骤(4)包括如下具体步骤：(4
‑
1)进行基于序列全局感知的用户迁移兴趣建模，包括全局新闻迁移图的构建和基于迁移感知的迁移兴趣表征两个部分；首先进行全局新闻迁移图的构建：将用户历史浏览新闻序列中新闻按照用户浏览...

【专利技术属性】
技术研发人员：胡明芮，刘波，严辉，孟青，曹玖新，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人