基于知识图谱具有可解释性的论文推荐方法及系统、终端技术方案

技术编号:28035601 阅读:68 留言:0更新日期:2021-04-09 23:17
本发明专利技术提供了一种基于知识图谱具有可解释性的论文推荐方法,包括如下步骤:从数据库中获取论文和用户的数据,利用获取的数据构建异构图;通过在构建的异构图中使用随机游走算法生成多条路径,利用图嵌入算法输出异构图中每个节点的向量表示;在异构图中查找到多条路径,将多条路径用矩阵表示,作为训练数据集的输入,将每条路径对应的某位用户对某论文的评分值,作为训练数据集的输出,构建训练集;搭建循环神经网络和全联接层模型,从训练集中学习循环神经网络和全联接层模型的参数;根据循环神经网络和全联接层模型为每位用户推荐预测评分最高的多篇论文,并向用户解释做出此推荐的依据。本发明专利技术通过引入知识图谱,使得推荐的结果更具可解释性。

【技术实现步骤摘要】
基于知识图谱具有可解释性的论文推荐方法及系统、终端
本专利技术涉及推荐系统
,具体地,涉及一种基于知识图谱具有可解释性的论文推荐方法及系统、终端。
技术介绍
随着大数据时代的来临,各个领域的数据量出现了井喷式的增长,内容的消费者面临的问题在于,从以前的“无内容可消费”,转变成“内容太多,不知道选择什么消费”,推荐系统就在这个场景下应运而生,从浩如烟海的物品中,为用户推荐其最可能喜欢的物品。推荐系统通过建立模型,并且学习大量已有的用户对物品的交互数据,如用户对物品的点击、浏览、收藏、分享、评分等行为,从而了解每个用户的偏好画像,进而可以给用户推荐其没有见过的但可能感兴趣的物品,从而解决用户选择困难症的问题。推荐系统按推荐原则划分,可以分为基于相似度的推荐,基于模型的推荐以及基于知识的推荐,前两者在过去的十年间产生了大量算法,最经典的当属基于协同过滤的推荐方法,这一方法通过分解用户对物品的评分矩阵,形成若干隐形特征,从而将具有相似隐形特征的物品推荐给同样具有该特征的用户。这一算法也在诸多各个领域产生了很好的效果,如电子商务、内本文档来自技高网...

【技术保护点】
1.一种基于知识图谱具有可解释性的论文推荐方法,其特征在于,包括如下步骤:/n步骤S1:从数据库中获取论文和用户的数据,利用获取的数据构建异构图;/n步骤S2:通过在构建的异构图中使用随机游走算法生成多条路径,利用图嵌入算法输出异构图中每个节点的向量表示;/n步骤S3:根据用户对论文的评分数据,为每一组“用户-论文”,在异构图中查找到多条路径,将多条路径用矩阵表示,作为训练数据集的输入,将每条路径对应的某位用户对某篇论文的评分值,作为训练数据集的输出,构建训练集;/n步骤S4:搭建包含长短期记忆的循环神经网络和全联接层的模型,从训练集中学习包含长短期记忆的循环神经网络和全联接层的模型的参数;/...

【技术特征摘要】
1.一种基于知识图谱具有可解释性的论文推荐方法,其特征在于,包括如下步骤:
步骤S1:从数据库中获取论文和用户的数据,利用获取的数据构建异构图;
步骤S2:通过在构建的异构图中使用随机游走算法生成多条路径,利用图嵌入算法输出异构图中每个节点的向量表示;
步骤S3:根据用户对论文的评分数据,为每一组“用户-论文”,在异构图中查找到多条路径,将多条路径用矩阵表示,作为训练数据集的输入,将每条路径对应的某位用户对某篇论文的评分值,作为训练数据集的输出,构建训练集;
步骤S4:搭建包含长短期记忆的循环神经网络和全联接层的模型,从训练集中学习包含长短期记忆的循环神经网络和全联接层的模型的参数;
步骤S5:根据包含长短期记忆的循环神经网络和全联接层的模型为每位用户推荐预测评分最高的多篇论文,并向用户解释做出此推荐的依据。


2.根据权利要求1所述的基于知识图谱具有可解释性的论文推荐方法,其特征在于,所述步骤S1包括:
步骤S11:从数据库中获取出论文、用户的相关数据,论文数据包括论文ID数据、论文作者、论文发表的出处及论文所属的研究领域,用户数据包括用户ID、用户对论文的评分数据;
步骤S12:根据获取的论文和用户的数据,在论文和其作者、论文和其发表出处、论文和其研究领域、用户和其打分过的论文与论文之间进行连边,每条边无方向,权重为1,每个节点的类型属于“论文”、“作者”、“发表出处”或“研究领域”,以此构建异构图。


3.根据权利要求1所述的基于知识图谱具有可解释性的论文推荐方法,其特征在于,所述步骤S2包括:
步骤S21:对异构图中的所有节点依次使用随机游走算法,得到多条路径集合,其中每个节点运行5次随机游走算法,得到5条路径,每条包含100个节点;
步骤S22:将生成的多条路径集合作为Word2Vec模型的输入,Word2Vec模型通过Python编程语言中已有的Gensim库直接获取;
步骤S23:训练Word2Vec模型,得到每个节点的向量表示,并将训练完成的Word2Vec模型存储在本地。


4.根据权利要求1所述的基于知识图谱具有可解释性的论文推荐方法,其特征在于,所述步骤S3包括:
步骤S31:浏览所有用户对论文的评分数据,针对每一条包含用户ui与论文pj的评分数据,查找异构图中连接ui与pj的所有长度为4的路径,并随机选择其中20条路径进行保留,舍弃其余路径;
步骤S32:利用步骤S2中的步骤S23中的训练完成的Word2Vec模型,为每一条路径生成一个矩阵作为表示;
步骤S33:将步骤S31生成并保留下来的所有路径集合,根据步骤S32所示的方法,采用矩阵表示,矩阵的集合作为下一步模型数据集的输入Train_X;
步骤S34:对于步骤S31中生成的Train_X,其每一项元素都是一条路径的矩阵表示,而这条路径连接了用户ui与论文pj;
步骤S35:对于Train_X中的每个训练样本,去查找对应的分值,将所有对应分值的集合构建成整...

【专利技术属性】
技术研发人员:谢智傅洛伊王新兵
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1