【技术实现步骤摘要】
本专利技术涉及学术论文检索领域,具体地,涉及一种基于论文间引用关系的学术地图展示方法。
技术介绍
科研活动是体现一个国家综合实力的重要且不可缺少的一方面,也是社会生产力不断发展的基石。在国际竞争日益激烈的今天,谁掌握了科学技术的制高点,谁就将引领下一次的科技革命,世界各国也因此将科学技术的发展放在了国家发展的核心位置。从我国科教兴国战略实施以来,国家各方面政策不断向科研方面倾斜,财政支出也稳步提升。据统计,2014年,全国共投入科技支出及研究与试验发展(R&D)经费13015.6亿元,比上年增加1169.0亿元,增长9.9%,且呈持续上升态势,表明我国研发实力进一步增强,科技水平不断提高。学术论文是科研活动中的重要一环。从科研经验来看,学术论文是研究人员确定研究方向,开展下一步工作与课题攻坚活动中重要的信息来源,也是深入了解前沿科学的重要组成部分。面对几何级增长的论文数量,如何从浩如烟海的论文中找到所需要的论文,并且做到快速性,时效性,准确性的有机结合,成为了广大科研工作者所共同面对的难题。在目前有一些开放的学术论文数据库,方便科研人员在工作中查找有关资料,但是这些数据库有着十分明显的缺点。第一,单一数据库中收藏的论文有限,而数据库间的交流不畅导致查找者无法迅速找出在查找方面关联紧密的论文;第二,数据库中的搜索系统不够先进,关键字提取所得的内容往往与想要的结果在细节上不够吻合;第三,大量的文本数据 ...
【技术保护点】
一种基于论文间引用关系的学术地图展示方法,其特征在于,包括如下步骤:步骤1:利用聚类算法及分布式处理法将事先获取的论文引用关系数据进行聚类,并划分为多个社区;步骤2:分析多个社区的属性和含义,将相关的引用关系数据存入数据库中;步骤3:读取数据库中的引用关系数据并构建论文引用网络,利用可视化工具动态展现论文间的关系,找到目标论文;步骤4:在多个视角上展示论文间的引用关系,形成学术地图。
【技术特征摘要】
1.一种基于论文间引用关系的学术地图展示方法,其特征在于,包括如下步骤:
步骤1:利用聚类算法及分布式处理法将事先获取的论文引用关系数据进行聚类,
并划分为多个社区;
步骤2:分析多个社区的属性和含义,将相关的引用关系数据存入数据库中;
步骤3:读取数据库中的引用关系数据并构建论文引用网络,利用可视化工具动态
展现论文间的关系,找到目标论文;
步骤4:在多个视角上展示论文间的引用关系,形成学术地图。
2.根据权利要求1所述的基于论文间引用关系的学术地图展示方法,其特征在于,
所述步骤1包括:
步骤1.1:使用互联网上公开的论文数据集,导出论文之间的引用关系数据;
步骤1.2:根据构建的学术网络图内的论文之间的引用关系,用ApacheSpark中的
GraphX模块来实现社区发现算法来对所有论文进行聚类处理;
所述聚类算法是指:将论文引用关系数据按照不同的类别进行划分,构成为社区的
结构;
所述社区发现算法是指:标签传递法LabelPropagationAlgorithm,简称LPA,以及
Louvain法;
标签传递法是指:每个节点的标签按相似度传播给相邻节点,在节点传播的每一步,
每个节点根据相邻节点的标签来更新本节点的标签,与本节点相似度越大,则对应的相
邻节点对本节点标注的影响权值越大,若相邻节点的标签越趋于一致,则标签就越容易
传播;
LouvainMethod方法是指:网络中的每个节点分配到对应各个节点的社区,对于节
点分配邻近的社区,若没有模块化增量,则节点所在社区位置不变;若存在模块化有增
量,则将节点加入到新的社区,当不存在模块增量时,将在同一社区的所有节点合并,
形成一个新的网络;
步骤1.3:在聚类过程中,通过调整不断地优化Louvain模块和LPA的迭代次数,
对比标签传递法和Louvain法这两种算法之间的结果与效率,选择LouvainMethod方
法,得到划分结果。
3.根据权利要求1所述的基于论文间引用关系的学术地图展示方法,其特征在于,
\t所述步骤2包括:
步骤2.1:对论文引用关系数据的内容进行分析,得到所划分社区的属性或含义;
步骤2.2:提取相关论文的信息,存储于MySQL数据库中用于进一步处理与展示。
4.根据权利要求1所述的基于论文间引用关系的学术地图展示方法,其特征在于,
所述步骤3包括:
步骤3.1:读取数据库中的论文引用...
【专利技术属性】
技术研发人员:谈兆炜,毛宇宁,刘长风,刘兴邦,张文斌,赵璟浩,宋振宇,沈嘉明,郭运奇,王彪,傅洛伊,王新兵,
申请(专利权)人:上海交通大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。