【技术实现步骤摘要】
本专利技术涉及学术网络分析与数据处理,尤其涉及一种基于时序图元模式迁移的学术网络节点分类方法与系统。
技术介绍
1、学术网络是一个由研究者、出版物、引用关系、学术机构和研究主题等元素构成的复杂网络系统。在这个网络中,节点可以代表论文、个体研究者或机构,而边则表示引用、合作关系或学术交流等关系。其中,以论文为中心的学术网络它通过论文间的引用关系、作者间的合作联系、期刊/会议的出版平台、机构的研究成果展示以及国家间的学术交流等多维度的连接来表示学术界的互动和知识流动。研究人员通过对其结构动态的研究,有助于研究者追踪研究趋势和发现潜在的研究领域,加速新技术的开发和应用,有利于形成学术共同体,促进学术交流和知识共享。
2、随着数字化时代的来临,学术网络的时序数据在论文发布系统、学术前沿探索以及学术交流合作等多个领域扮演着越来越关键的角色。学术网络数据的快速增长和种类的多样化,给研究机构和研究人员带来了前所未有的挑战。学术网络的数据具有高维度特性,例如,它可能包含会议、期刊、论文、作者等多样实体,每个实体都具有丰富的属性。此外,学术网
...【技术保护点】
1.一种基于时序图元模式迁移的学术网络节点分类方法,其特征在于,包括以下步骤:
2.如权利要求1所述的基于时序图元模式迁移的学术网络节点分类方法,其特征在于,所述步骤(S1)中,五个领域学科具体为:计算机、数学、金融、生物、化学、英语。
3.如权利要求1所述的基于时序图元模式迁移的学术网络节点分类方法,其特征在于,所述步骤(S1)具体为:首先获取五个领域学科的期刊论文数据,主要为文本文件,包括论文标题,发表年份,作者,发表期刊,所属机构,发表会议;将文本文件保存为JSON格式文件,构建一个用来存储期刊和其对应ID的字典文件,然后迭代逐行处理论文
...【技术特征摘要】
1.一种基于时序图元模式迁移的学术网络节点分类方法,其特征在于,包括以下步骤:
2.如权利要求1所述的基于时序图元模式迁移的学术网络节点分类方法,其特征在于,所述步骤(s1)中,五个领域学科具体为:计算机、数学、金融、生物、化学、英语。
3.如权利要求1所述的基于时序图元模式迁移的学术网络节点分类方法,其特征在于,所述步骤(s1)具体为:首先获取五个领域学科的期刊论文数据,主要为文本文件,包括论文标题,发表年份,作者,发表期刊,所属机构,发表会议;将文本文件保存为json格式文件,构建一个用来存储期刊和其对应id的字典文件,然后迭代逐行处理论文数据,检查论文数据里的venue字段是否存在于上述字典,如果存在,将其论文id和引文id分别保存到p_id2one和ref_2one字典里,获取新的论文数据后只需要检索其是否在对应p_id2one字典里,检查获取后的论文数据存在对应p_id2one字典中时,则属于对应的学科领域,如果其不存在对应的p_id2one字典中时,则检查是否属于ref_2one字典,检查获取后的论文数据在ref_2one字典中时,则检查引文id否有期刊,如果有期刊且属于别的学科则不写入,如果没有期刊则写入,其次如果论文没有期刊则直接写入,将处理结果保存为对应学科的文本文件。
4.如权利要求1所述的基于时序图元模式迁移的学术网络节点分类方法,其特征在于,步骤(s2)中,所述构建时序图具体为:读取对应学科的文本文件保存为csv文件,包括字段主要标题,id,年份,引用次数,作者,期刊,研究领域;读取研究领域数据表文件和论文数据表文件,构建fid2hisnum字典,存储每个研究领域的年度论文数量,利用minhash和minhashlsh识别重复的研究领域,进行合并并且更新字典;使用函数构建论文id的映射字典,并初始化论文和研究领域的计数器,遍历论文数据,为每篇论文创建节点,并在论文和引文之间建立边,利用dgl库构建异构图谱,边信息用来存储所需特征信息,包括引用次数,作者,期刊。
5.如权利要求1所述的基于时序图元模式迁移的学术...
【专利技术属性】
技术研发人员:郑铜亚,王龙龙,徐超清,金苍宏,宋明黎,
申请(专利权)人:浙大城市学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。