一种基于修剪图谱聚类的学术团队划分方法技术

技术编号:29673583 阅读:20 留言:0更新日期:2021-08-13 21:55
一种基于修剪图谱聚类的学术团队划分方法,包括以下步骤:1)从海量学术数据中构建学术知识图谱,并从图谱中提取学者间的关系网络;2)计算网络节点相似度和网络整体模块度,根据节点相似度更新关系权重;3)利用模块度增益对关系网络进行团队划分;4)通过团队相似度计算邻接团队聚合导致的模块度增益,并选取模块度增益最大且超过阈值的邻接团队进行聚合,重复迭代直到网络模块度收敛;5)对得到的学术团队进行筛选,去掉不符合特征要求的团队,得到最终学术团队划分结果。本发明专利技术能够从高校海量学术数据中准确实现学术团队划分。

【技术实现步骤摘要】
一种基于修剪图谱聚类的学术团队划分方法
本专利技术涉及知识图谱、社区发现、智慧校园等领域,特别给出了一种基于修剪图谱聚类的学术团队划分方法。
技术介绍
知识图谱本质上是一种揭示实体之间关系的语义网络,可以对现实世界的事务及其相互关系进行形式化地描述。知识图谱的基本组织形式是实体三元组(实体,关系,实体)或属性三元组(实体,属性,属性值),实体间或实体属性值间通过相关链接构成大规模的结构化网络,即知识图谱。社区发现指的是根据网络中节点间的相互关系,将节点划分成不同的几个社区,同一社区内的节点与节点之间的连接很紧密,而社区与社区之间的连接比较稀疏。模块度(LectureNotesinComputerScience,2008)用来衡量社区划分结果的好坏。如果一个社区划分算法能将连接比较稠密的点划分在一个社区中,而社区之间的连接比较稀疏,这样划分得到的网络模块度的值就会比较大。模块度的提出将传统社区发现算法带入了基于模块度优化算法。基于模块度进行社区发现的Louvain算法(JournalofStatisticalMechanics-t本文档来自技高网...

【技术保护点】
1.一种基于修剪图谱聚类的学术团队划分方法,其特征在于,所述方法包括以下步骤:/n1)构建学术知识图谱/n融合多数据源的学者的基本信息、学术论文、纵向项目、横向项目、专利、科研奖励作为知识库,抽取出其中的实体、关系和属性,经过共指消解,构建出面向学者的学术知识图谱;/n2)提取学者合作关系/n从学术知识图谱中提取学者间的合作关系网络,即形如(学者,合作关系,学者)的三元组,其中合作关系是一个量化的关系权重,初始值设置为合作次数;/n3)计算节点的相似度/n基于局部链接的方法计算节点相似度,局部链接指节点间直接相链的关系,节点相似度计算公式为:/n

【技术特征摘要】
1.一种基于修剪图谱聚类的学术团队划分方法,其特征在于,所述方法包括以下步骤:
1)构建学术知识图谱
融合多数据源的学者的基本信息、学术论文、纵向项目、横向项目、专利、科研奖励作为知识库,抽取出其中的实体、关系和属性,经过共指消解,构建出面向学者的学术知识图谱;
2)提取学者合作关系
从学术知识图谱中提取学者间的合作关系网络,即形如(学者,合作关系,学者)的三元组,其中合作关系是一个量化的关系权重,初始值设置为合作次数;
3)计算节点的相似度
基于局部链接的方法计算节点相似度,局部链接指节点间直接相链的关系,节点相似度计算公式为:



其中,S(i,j)表示节点i与节点j之间的相似度值,St(i)表示节点i与节点i的邻居节点组成的集合,St(j)表示节点j与节点j的邻居节点组成的集合,We表示与节点Ve直接相链的所有边的权重之和,计算出节点i与节点j共同邻居节点的权重之和的倒数,将节点i的邻居节点和节点j的邻居节点所带来的影响也考虑其中,使计算得到的节点相似度值更为精确;
根据计算得到的节点相似度对关系权重进行更新,节点相似度能够有效衡量一个学术团队内各成员之间在不同领域合作关系的紧密程度;
4)计算网络模块度
根据步骤3)中计算得到的节点相似度,进一步计算网络的模块度,模块度计算公式为:



其中,∑in表示网络中边的相似度之和,∑tot表示与网络中所有节点相链的相似度之和,TS表示网络中所有节点相似度之和;
5)学术团队划分
初始时,每个节点各自隶属一个科研团队,按照节点的序号进行遍历,步骤如下:
(5.1):计算节点加入其邻居节点的模块度增益,模块度增益计算公式为:



其中,Sin[i]表示群i中边的权重之和,tot[C]表示与C中所有节点与其直接相链的...

【专利技术属性】
技术研发人员:张元鸣周伟跃肖刚陆佳炜程振波
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1