System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种针对高校科研人员的合作网络可视化构建方法技术_技高网

一种针对高校科研人员的合作网络可视化构建方法技术

技术编号:41251067 阅读:5 留言:0更新日期:2024-05-09 23:59
本发明专利技术提供了一种针对高校科研人员的合作网络可视化构建方法,包括以下步骤:步骤S1:获取科研人员的基础数据和成果数据,以构建数据集;步骤S2:进行数据清洗和预处理:去除重复数据、粗粒度数据拆分和不规则数据清洗;步骤S3:基于所述数据集,进行合作数据筛选;步骤S4:构建合作关联网络:将待构建合作网络的科研人员作为中心节点;与中心节点存在直接联系的科研人员作为主节点;与主节点存在联系的科研人员作为副节点;通过不同的图例对科研人员所属单元进行区分;步骤S5:计算节点间的关联系数,所述关联系数越大,则节点间连线的边越粗;以完成对高校科研人员的画像。

【技术实现步骤摘要】

本专利技术涉及人物画像,具体涉及一种针对高校科研人员的合作网络可视化构建方法


技术介绍

1、随着科研人员规模的不断扩大,科技管理工作面临着严峻的挑战。对高校科研人员这一群体进行全面、客观、准确的了解是攻关技术、推进有组织的科研、统筹该科研力量的重要基础,针对科研人员画像与合作网络挖掘与析取是实现此目标的有效途径之一。

2、在高校信息化建设的背景下,科研大数据的建设取得了长足的进步。基于高校科研数据库,为实现多维度的科研人员画像与科研合作网络的析取提供了基础数据支持。然后现有的针对科研人员的画像方法,并没有针对其合作关系进行表示,导致科研人员间的合作关系难以掌握,科研成就也难以进行整合分析,因此亟需一种针对科研人员之间合作的相关网络。


技术实现思路

1、本专利技术提出了一种针对高校科研人员的合作网络可视化构建方法,以解决现有没有针对科研人员合作网络可视化表示的技术问题。

2、为解决上述技术问题,本专利技术提供了一种针对高校科研人员的合作网络可视化构建方法,包括以下步骤:

3、步骤s1:获取科研人员的基础数据和成果数据,以构建数据集;

4、步骤s2:进行数据清洗和预处理:去除重复数据、粗粒度数据拆分和不规则数据清洗;

5、步骤s3:基于所述数据集,进行合作数据筛选;

6、步骤s4:构建合作关联网络:将待构建合作网络的科研人员作为中心节点;与中心节点存在直接联系的科研人员作为主节点;与主节点存在联系的科研人员作为副节点;通过不同的图例对科研人员所属单元进行区分;

7、步骤s5:计算节点间的关联系数,所述关联系数越大,则节点间连线的边越粗;以完成对高校科研人员的画像。

8、优选地,所述基础数据包括:科研人员姓名、工号、所在单位、所在学科、研究方向和人事状态;所述成果数据包括:项目、论文、专利、获奖、专著和成果内容,所述成果内容包括:题目、关键词、摘要、人员和人员排名。

9、优选地,步骤s2包括:数据集中去除论文、专利、项目数据重复项;拆分论文作者和专利专利技术人的并列数据;将获奖数据中人员排名、单位排名数据和专利数据中的排名的汉字改为数字,修正不规则数字;合并单位名称有差异实际为同一单位的名称;删除涉及敏感单位的名称。

10、优选地,所述关联系数包括项目合作关联系数、论文合作关联系数、专利合作关联系数和单位合作关联系数。

11、优选地,所述项目合作关联系数rproject的表达式为:

12、

13、式中,cproject表示合作项目数据集,amount表示合作金额,levelproject表示项目的等级权重,rprojec_min表示归一化前项目合作关联系数的最小值,rproject_max表示归一化前项目合作关联系数的最大值,θ表示关联系数最小阈值系数。

14、优选地,所述论文合作关联系数rpaper的表达式为:

15、

16、式中,cpaper表示合作论文数据集,levelpaper表示论文的等级权重,rank表示作者顺序排位,rpaper_min表示归一化前论文合作关联系数的最小值,rpaper_max表示归一化前论文合作关联系数的最大值,θ表示关联系数最小阈值系数。

17、优选地,所述项目合作关联系数rpatent的表达式为:

18、

19、式中,cpatent表示合作专利数据集,levelpatent表示专利的等级权重,rank表示作者顺序排位,urank代表单位排名,rpatent_min表示归一化前专利合作关联系数的最小值,rpatent_max表示归一化前专利合作关联系数的最大值,θ表示关联系数最小阈值系数。

20、优选地,所述项目合作关联系数runit的表达式为:

21、

22、式中,cunit表示合作单位数据集,amount表示合作金额,runit_min表示归一化前专利合作关联系数的最小值,runit_max表示归一化前专利合作关联系数的最大值,θ表示关联系数最小阈值系数。

23、优选地,所述合作网络构建方法还包括科研能力画像步骤:

24、步骤s201:根据高校各单位教学与科研性质,将单位划分为四类:教学为主型的a类、教学与科研兼顾型i的b类、教学与科研兼顾型ii的c类、科研为主型d类,设定对应的权重,从a至d权重降低;

25、步骤s202:项目、论文、专利、获奖、专著、成果转化、承接重大重点项目能力以及主持国家级项目能力八个维度,建立一级指标和二级指标,并对二级指标设定相应权重;

26、步骤s203:通过以下公式计算科研人员评分:

27、

28、式中,w表示学部评分权重,p表示科研人员一级指标中的成果,cp表示科研人员各一级指标的成果数据集,n表示评分维度的二级指标数,sij表示二级指标权重;

29、步骤s204:根据每个科研人员的评分,对所述合作关联网络的大小进行区别,评分越大,节点越大。

30、优选地,所述合作网络构建方法还包括科研人员的特征画像步骤:

31、步骤s301:基于科研特征构件和科研特征标签构建科研特征树,其中顶事件为科研特征;

32、步骤s302:通过所述科研特征数,构建贝叶斯网络;

33、步骤s303:融合语义相似度权重ssw和频率集中度权重fcw确定条件概率;

34、所述语义相似度权重ssw的表达式为:

35、

36、式中,e(xi)为基础事件xi的词向量表示,e(tj)为科研特征类别tj的词向量表示;

37、所述频率集中度权重fcw的表达式为:

38、

39、式中,tf(xi,tj)为科研特征类别tj中基础事件xi的数量,tf(tj)科研特征类别tj中基础事件总数;

40、步骤s304:通过以下公式进行加权贝叶斯公式与权重计算,以进行科研特征的预测标注:

41、

42、w(i,j)=ssw*fcw;

43、式中,p()表示事件发生概率,m表示基础事件数。

44、步骤s305:将所述特征标注引入合作关联网络进行可视化展示。

45、本专利技术的有益效果至少包括:针对多维度的科研人员画像,我们关注科研人员的横纵向项目经历、发表科研论文信息、获奖信息、专利信息等多维度异构数据;针对科研成果数据进行去重;针对部分粗粒度数据进行数据预处理,如科研成果的作者未拆分等情况;针对合作网络析取,分析项目合作网络、论文合作网络、专利合作网络以及单位合作网络四种,技术上涉及到合作网络数据筛选,合作网络生成算法的建模,节点间关联系数的建模计算以及各项合作网络的可视化生成技术。

46、通过对高校科研人员的画像与合作网络进行分析,可以了解科研人员的学术背景、研究领域、学术能力本文档来自技高网...

【技术保护点】

1.一种针对高校科研人员的合作网络可视化构建方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种针对高校科研人员的合作网络可视化构建方法,其特征在于:所述基础数据包括:科研人员姓名、工号、所在单位、所在学科、研究方向和人事状态;所述成果数据包括:项目、论文、专利、获奖、专著和成果内容,所述成果内容包括:题目、关键词、摘要、人员和人员排名。

3.根据权利要求1所述的一种针对高校科研人员的合作网络可视化构建方法,其特征在于:步骤S2包括:数据集中去除论文、专利、项目数据重复项;拆分论文作者和专利专利技术人的并列数据;将获奖数据中人员排名、单位排名数据和专利数据中的排名的汉字改为数字,修正不规则数字;合并单位名称有差异实际为同一单位的名称;删除涉及敏感单位的名称。

4.根据权利要求1所述的一种针对高校科研人员的合作网络可视化构建方法,其特征在于:所述关联系数包括项目合作关联系数、论文合作关联系数、专利合作关联系数和单位合作关联系数。

5.根据权利要求4所述的一种针对高校科研人员的合作网络可视化构建方法,其特征在于:所述项目合作关联系数rproject的表达式为:

6.根据权利要求4所述的一种针对高校科研人员的合作网络可视化构建方法,其特征在于:所述论文合作关联系数rpaper的表达式为:

7.根据权利要求4所述的一种针对高校科研人员的合作网络可视化构建方法,其特征在于:所述项目合作关联系数rpatent的表达式为:

8.根据权利要求4所述的一种针对高校科研人员的合作网络可视化构建方法,其特征在于:所述项目合作关联系数runit的表达式为:

9.根据权利要求1述的一种针对高校科研人员的合作网络可视化构建方法,其特征在于:所述合作网络构建方法还包括科研能力画像步骤:

10.根据权利要求1所述的一种针对高校科研人员的合作网络可视化构建方法:所述合作网络构建方法还包括科研人员的特征画像步骤:

...

【技术特征摘要】

1.一种针对高校科研人员的合作网络可视化构建方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种针对高校科研人员的合作网络可视化构建方法,其特征在于:所述基础数据包括:科研人员姓名、工号、所在单位、所在学科、研究方向和人事状态;所述成果数据包括:项目、论文、专利、获奖、专著和成果内容,所述成果内容包括:题目、关键词、摘要、人员和人员排名。

3.根据权利要求1所述的一种针对高校科研人员的合作网络可视化构建方法,其特征在于:步骤s2包括:数据集中去除论文、专利、项目数据重复项;拆分论文作者和专利发明人的并列数据;将获奖数据中人员排名、单位排名数据和专利数据中的排名的汉字改为数字,修正不规则数字;合并单位名称有差异实际为同一单位的名称;删除涉及敏感单位的名称。

4.根据权利要求1所述的一种针对高校科研人员的合作网络可视化构建方法,其特征在于:所述关联系数包括项目合作关联系数、论文合作关联系数、专利合作关联系数...

【专利技术属性】
技术研发人员:傅魁张砚斌朱明童高峰王晶
申请(专利权)人:武汉理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1