基于链接相似度的学术文献检索方法及系统技术方案

技术编号:41327302 阅读:40 留言:0更新日期:2024-05-13 15:05
本发明专利技术公开了一种基于链接相似度的学术文献检索方法及系统,该方法包括以下步骤:步骤1,将学术文献根据是否存在引用关系转化为引用网络图;步骤2,给定学术文献节点a作为请求,使用基于Hub Depressed Index的相似度模型HdiSim来计算节点a与其他科学文献节点之间的相似度;步骤3,使用模块化分解和共享部分和策略来加速HdiSim的计算;步骤4,获取相似度排名最高的前k篇学术文献,从而得到与学术文献a相似的学术文献。与传统方法相比,本发明专利技术能够捕获到更加丰富且合理的相似信息,从而实现准确且高效的检索。

【技术实现步骤摘要】

本专利技术涉及学术文献检索技术,特别是一种基于链接相似度的学术文献检索方法及系统


技术介绍

1、随着学术研究领域的不断扩大和深入,学术文献数据库规模不断扩大,使用人数不断上升,对学术文献检索的需求也在不断增长,如何从海量的学术文献中快速找到相关的学术文献和学术资源成为了首要解决的难题。

2、目前学术文件检索方法可以大致分为两类,一种是基于文本相似度的方法,比如通过计算两篇学术文献之间的共同关键词、短语、摘要或者全文内容,通过词频等基础技术,从而去计算学术文献之间的相似度,但是这种方法往往需要全文文献的信息,计算的时间复杂度较高。另一种则是基于网络结构的链接和拓扑结构的相似度模型,将学术文献引用关系抽象成图,其中学术文献表示节点,引用关系表示边,通过计算图中任意两个节点之间的相似度来度量学术文献之间的相似度,这种方法所需信息较少,仅需文献的引用关系即可,且往往能获取较好的检索结果。

3、目前存在众多基于链接的相似度模型,其中在学术文献引用网络中应用较为广泛的是c-rank模型,该模型将相似性分数分为了jaccard系数、节点a与节点本文档来自技高网...

【技术保护点】

1.一种基于链接相似度的学术文献检索方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于链接相似度的学术文献检索方法,其特征在于,步骤2具体包括如下步骤:

3.根据权利要求2所述的基于链接相似度的学术文献检索方法,其特征在于,步骤3具体包括如下步骤:

4.一种基于链接相似度的学术文献检索系统,其特征在于,包括:

5.根据权利要求4所述的基于链接相似度的学术文献检索系统,其特征在于,第二模块,用于给定节点a作为请求,使用Hub Depressed Index的点对相似度模型HdiSim计算全局节点相似度,具体为:

6.根...

【技术特征摘要】

1.一种基于链接相似度的学术文献检索方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于链接相似度的学术文献检索方法,其特征在于,步骤2具体包括如下步骤:

3.根据权利要求2所述的基于链接相似度的学术文献检索方法,其特征在于,步骤3具体包括如下步骤:

4.一种基于链接相似度的学术文献检索系统,其特征在于,包括:

5.根据权利要求4所述的基于链接相似度的学术文献检索系统,其特征在于,第二模块,用于给定节点a作为请求,使用hub depressed index的点对相似度模型hdisim计算全局节点相似度,具体为:

6....

【专利技术属性】
技术研发人员:曹铖俞唯仁袁龙
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1