一种基于学术网络的团队构建方法技术

技术编号：20160516 阅读：20 留言：0更新日期：2019-01-19 00:13

本发明专利技术公开了一种基于学术网络的团队构建方法，将学者的论文合著行为作为合作行为的具体表现，利用学者间的合作行为建立学术团队构建模型。本发明专利技术首先提出合作距离来更全面的衡量学者间的合作行为，并建立新的合作关系网络。为了丰富网络特征，提升聚类的效果，本发明专利技术将网络映射到测地线空间，结合密度梯度转移和K‑means聚类方法得到最终的团队划分情况。实验结果表明，本发明专利技术提出的模型适合处理复杂的学术网络结构，相比其他的团队识别方法具有更高的准确性和可靠性。本发明专利技术的实验结果也验证了团队科学现象在学术网络中的普遍性，并能够良好地反映网络中学术团队的组成和结构。本发明专利技术提供了学术网络中团队构建的一种新方法。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于学术网络的团队构建方法
本专利技术涉及学术领域中基于学者的论文合著网络对学者进行学术团队构建的方法，尤其涉及到一种基于测地线空间密度梯度转移与K-means线性聚类相结合对学者进行团队划分的方法。
技术介绍
在当今科学研究日益多样化的时代，不同学科研究人员和不同研究团体之间的合理化协作，有利于丰富知识背景，提高研究的效率，从而完成高质量的任务。对学术团队的构建与识别的研究能够发现各学科人才之间的合作形势，促进学科的交叉和知识的传播；也可以为研究人员提供一种合理的合作模式建议来提高他们的能力和知识的质量。学者的合著关系及其引用关系构成了巨大的网络，学术数据的膨胀使得现有的社团识别方法，如GN，Louvain等算法很难解决学术网络中的团队构建问题。因此需要研究人员提出一种能够准确度，实用性更高的团队构建方法。
技术实现思路
本专利技术的目的主要针对现有研究的准确性低、可靠性差的不足，并结合学者合作的特点提出基于学术网络的团队构建方法，通过提出合作距离的概念来衡量学者间的合作紧密程度，并将合作距离作为团队之间划分的关键。同时，为了丰富网络特征，利用节点之间距离将合作网络映射到测地线空间，利用节点对于测地线空间的密度影响，迭代估算出节点漂移的方向和最终位置，并结合K-means算法估算出学术网络中的团队数目。本专利技术首次使用测地线空间密度转移与K-means聚类相结合的方法为学术团队构建问题提供了一种新方法。本专利技术的技术方案：一种基于学术网络的团队构建方法，步骤如下：步骤1)通过统计真实的论文发表情况计算合作窗口年限以合著关系为基础进行团队构建，将学者的...

【技术保护点】
1.一种基于学术网络的团队构建方法，其特征在于，步骤如下：步骤1)通过统计真实的论文发表情况计算合作窗口年限以合著关系为基础进行团队构建，将学者的论文合著行为作为合作关系的具体体现，通过统计分析学者之间的合作情况，确定目标窗口年限为5年；步骤2)利用步骤1)中得到的合作窗口年限中的论文相关数据计算学者之间的合作距离，建立新的合作网络模型，并将网络映射到测地线空间；包括以下两个步骤：2.1)对学者的合作关系建模，只考虑学者间合作次数或频率，来衡量学者之间合作关系的强弱比较片面，综合考虑学者间的合作次数和发表论文频率，提出合作距离；合作距离定义如下：两名学者分别在5年内发表的论文的数量的乘积减去两名学者5年内合作论文数量的平方除以这两名学者分别在5年内发表的论文的数量的乘积，计算公式为：

【技术特征摘要】
1.一种基于学术网络的团队构建方法，其特征在于，步骤如下：步骤1)通过统计真实的论文发表情况计算合作窗口年限以合著关系为基础进行团队构建，将学者的论文合著行为作为合作关系的具体体现，通过统计分析学者之间的合作情况，确定目标窗口年限为5年；步骤2)利用步骤1)中得到的合作窗口年限中的论文相关数据计算学者之间的合作距离，建立新的合作网络模型，并将网络映射到测地线空间；包括以下两个步骤：2.1)对学者的合作关系建模，只考虑学者间合作次数或频率，来衡量学者之间合作关系的强弱比较片面，综合考虑学者间的合作次数和发表论文频率，提出合作距离；合作距离定义如下：两名学者分别在5年内发表的论文的数量的乘积减去两名学者5年内合作论文数量的平方除以这两名学者分别在5年内发表的论文的数量的乘积，计算公式为：其中，Pi和Pj分别表示学者i，j在5年内发表的论文，|P|表示学者5年发表的论文数目；2.2)将学者作为网络中的节点，学者间的合作关系作为边，步骤2.1)得到的学者之间的合作距离作为网络中节点之间边的权重建立新的合作网络模型；根据学术网络连通性强的特点，i节点的测地线空间向量pi表示节点i和网络中其他节点距离的集合，其中网络中两点之间的距离dis(i,j)为i，j两点间最短路径的权重和；利用测地线空间向量将网络映射到n维测地线空间中，n为网络中节点数目；网络中的测地线空间距离表示为：pi和pj分别表示节点i和j的测地线空间向量，Λ是一个n×n的对角型系数矩阵，用来根据网络维数对测地线空间距离进行调整；根据欧几里得距离的计算公式，其中k≠{i,j}，n为网络中的节点数目；步骤3)计算步骤2)中测地线空间中由每个节点产生的密度场分布，并根据密度梯度变化对节点转移；3.1)利用步骤2)中的公式计算节点的测地线空间向量，网络中节点会被映射到测地线空间中，在测地线空间中每个节点产生一个连续不断的密度场，设节点j产生的这个密度场服从期望为μj，标准方差为的高斯分布，则节点j对测地线空间中任一点x∈Rn产生的密度分布为：其中，ε是标准化参数，px表示节点x的测地线空间向量；随着网络中测地线空间距离di,j的增加，密度分布将会呈现指数型的下降；3.2)因为节点在测地线空间产生密度场的行为是相互独立的，所以任意一点x∈Rn的密度都是由网络中所有其他节点形成的密度场叠加，则形成最终的密度分布如下所示：其中，Λ是一个n×n的对角型系数矩阵，K(·)是一个有界的非负函数，px是节点x的...

【专利技术属性】
技术研发人员：宁兆龙，张凯源，孔祥杰，夏锋，
申请(专利权)人：大连理工大学，
类型：发明
国别省市：辽宁,21

全部详细技术资料下载我是这个专利的主人