融合知识图谱和用户长短期兴趣的新闻推荐方法、系统及介质技术方案

技术编号：37370426 阅读：10 留言：0更新日期：2023-04-27 07:15

本发明专利技术公开了一种融合知识图谱和用户长短期兴趣的新闻推荐方法、系统及介质，该方法包括：获取用户的历史点击新闻列表和多篇候选新闻，并分别输入新闻语义编码器，得到历史点击新闻表示列表和候选新闻表示；新闻语义编码器先分别学习不同类型的新闻表示，再将所有新闻表示聚合成统一的新闻表示；将历史点击新闻表示列表输入用户兴趣编码器，得到用户的兴趣表示；用户兴趣编码器包括注意力模块和GRU网络，分别从历史点击新闻序列中学习用户的长期兴趣和短期偏好；将候选新闻表示和兴趣表示输入点击预测器，得到候选新闻的点击得分，进而得到新闻推荐列表并推荐给用户。本发明专利技术通过构建新闻语义编码器和用户兴趣编码器，提升了新闻推荐的性能。闻推荐的性能。闻推荐的性能。

全部详细技术资料下载

【技术实现步骤摘要】
融合知识图谱和用户长短期兴趣的新闻推荐方法、系统及介质

[0001]本专利技术涉及人工智能和新闻推荐
，特别是涉及一种融合知识图谱和用户长短期兴趣的新闻推荐方法、系统、计算机设备及存储介质。

技术介绍

[0002]随着互联网技术的发展和应用，越来越多人从在线新闻平台上获取及时资讯。但每天各在线新闻平台放送的新闻量远超用户的阅读量，用户要从海量新闻中选择自己感兴趣的新闻显然不切实际，所以新闻推荐系统成为许多在线新闻平台的必要组成部分，它用于从海量新闻中为用户推荐可能感兴趣的新闻，以缓解信息过载。
[0003]传统的新闻推荐方法有协同过滤推荐方法(DAS.A,et al.In Proceedings of the 16th International Conference on World Wide Web.WWW,2007:271
–
280；XUE.J,et al.JCAI,2017:3203
–
3209)、基于内容的推荐方法(IJNTEMA.W,et al.EDBT/ICDT,2010:22
‑
26；HUANG P S,et al.CIKM,2013:2333
–
2338)和混合推荐方法(MORALES.F,et al.WSDM,2012:153
‑
162；LI.L,et al.SIGIR,2011:125
–
134)等。协同过滤推荐方法通过协同不同用户的反馈、评价和意见等一起对海量的信息进行过滤...

【技术保护点】

【技术特征摘要】
1.一种融合知识图谱和用户长短期兴趣的新闻推荐方法，其特征在于，所述方法包括：获取用户的历史点击新闻列表和多篇候选新闻；将历史点击新闻列表和多篇候选新闻分别输入新闻语义编码器，分别得到历史点击新闻表示列表和候选新闻表示；其中所述新闻语义编码器先分别学习不同类型的新闻表示，再将所有的新闻信息表示聚合成统一的新闻表示；将历史点击新闻表示列表输入用户兴趣编码器，得到用户的兴趣表示；其中所述用户兴趣编码器包括注意力模块和GRU网络；所述注意力模块从历史点击新闻序列中对用户反复点击的一类新闻施加更高的权重以学习用户的长期兴趣表示；所述GRU网络从历史点击新闻序列中学习用户随时间动态变化的短期偏好表示，其最后一个隐层从用户最近的浏览历史中学习用户的短期表现，以捕捉用户的短期偏好；最后聚合用户的长期兴趣表示和短期偏好表示，得到用户的兴趣表示；将候选新闻表示和用户的兴趣表示输入点击预测器，得到多篇候选新闻的点击得分；根据点击得分，获取新闻推荐列表并推荐给用户。2.根据权利要求1所述的新闻推荐方法，其特征在于，历史点击新闻和候选新闻均包括标题、简介、类别和知识实体；所述新闻语义编码器包括标题编码器、简介编码器、类别编码器、知识实体编码器和特征注意力网络，其中：所述标题编码器，用于从新闻标题中学习新闻表示；所述简介编码器，用于从新闻简介中学习新闻表示；所述类别编码器，用于从新闻类别中学习新闻表示；所述知识实体编码器，用于从知识实体中学习新闻表示；所述特征注意力网络，用于从不同类型的新闻表示中聚合统一的新闻语义表示。3.根据权利要求2所述的新闻推荐方法，其特征在于，所述标题编码器包括词嵌入层、CNN神经网络和词注意力层；所述标题编码器，用于从新闻标题中学习新闻表示，包括：词嵌入层用于将新闻标题从单词序列转换成低维稠密的词向量序列；CNN网络根据所述词向量序列，通过捕捉单词的上下文语境来学习单词的上下文表示；词注意力层根据所述单词的上下文表示，为用户识别新闻标题中重要的词，得到新闻标题中单词的注意力权重；将新闻标题中所有单词的上下文表示进行加权求和，得到新闻标题的新闻表示。4.根据权利要求3所述的新闻推荐方法，其特征在于，所述简介编码器和所述标题编码器的结构相同，将新闻简介中所有单词的上下文表示进行加权求和，得到新闻简介的新闻表示。5.根据权利要求2所述的新闻推荐方法，其特征在于，所述类别编码器包括类别ID嵌入层和隐含层；所述类别编码器，用于从新闻类别中学习新闻表示，包括：类别ID嵌入层的输入是主类别ID表示子类别ID表示，用于将离散的类主类别ID表示和子类别ID表示转换成低维稠密的类别嵌入g
c
和g
sc
；隐含层根据所述类别嵌入g
c
和g
sc
，分别学习类别嵌入中隐含的类别信息表示z
c
和z
sc
；
类别信息表示z
c
和z
sc
作为新闻类别中的新闻表示。6.根据权利要求2所述的新闻推荐方法，其特征在于，所述知识实体编码器，用于从知识实体中学习新闻表示，包括：首先进行知识实体提炼、构建知识子图，包括：提取新闻标题和简介中所提及的知识实体，其中MIND
‑
small数据集已给出了新闻标题和简介中提及的知识实体；由于新闻标题和简介提及的知识实体数量少，利用WikiData知识图谱将新闻标题和简介提及的知识实体扩展到一跳内的所有实体；将所有实体构建为知识子图，并从WikiData知识图谱中提取出实体之间的所有关系；然后，对于构建的知识子图，使用TransE知识图嵌入方法进行实体表示学习，得到知识实体嵌入序列；最后，将实体注意力网络应用于知识实体嵌入序列中，为用...

【专利技术属性】
技术研发人员：李西明，陈志浩，郭玉彬，
申请(专利权)人：华南农业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人