【技术实现步骤摘要】
一种融合多源数据的领域专家科研关系网络构建方法
[0001]本专利技术涉及数据处理
,应用于数据挖掘和专家画像技术,具体涉及一种融合多源数据的领域专家科研关系网络构建方法。
技术介绍
[0002]专家科研关系网络是专家的标签化描述及专家之间科研关系的集合,属于专家画像的一种表现形式,能为人才评价、项目评审、协同决策等应用提供重要的循证依据。特别是,在协同决策领域,某一领域的多个专家同时进行决策时难免遇到冲突,需要考虑到领域专家之间多维度的科研关系,才能正确模拟真实的冲突消解过程。
[0003]目前许多机构都在构建专家科研关系网络,取得了一些成果,如科技情报大数据挖掘与服务系统平台AMiner中的专家科研关系网络包含合作、学生、导师等多种关系,但中国专家的信息较少且存在很多重复词条;知网专家库中的专家科研关系网络包含合作、引用、被引关系,但这些关系还不够完善;地理信息专业知识服务系统中的专家科研关系网络考虑到了专家的地理信息,但只有合作这一种关系且数据来源匮乏。
[0004]现有技术中,公开号为CN112 ...
【技术保护点】
【技术特征摘要】
1.一种融合多源数据的领域专家科研关系网络构建方法,其特征在于,包括如下步骤:S1:从多源库中获取领域专家多源数据;S2:对领域专家多源数据进行清洗、集成、转换的预处理,去除重复的领域专家数据,将专家姓名和论文数据集成对应,构造领域专家多维度的属性数据;S3:基于领域专家多维度的属性数据,分别构建领域专家多维度语义关系网络;S4:基于领域专家多维度的属性数据,分别构建领域专家多维度影响关系网络。2.如权利要求1所述的方法,其特征在于:所述步骤S1具体包括如下步骤:S101:根据研究领域在第一数据库中获取领域专家初始检索列表;S102:根据初始检索列表在第二数据库中获取数据,并扩充检索列表;S103:根据扩充后的检索列表在第三数据库中获取数据。3.如权利要求2所述的方法,其特征在于:所述第一、二、三数据库分别为公开专家库、中文数据库和外文数据库。4.如权利要求1所述的方法,其特征在于:所述步骤S2中构造领域专家多维度的属性数据,具体为:学术、合作和社交三个方面的属性;其中,学术属性数据包括论文总数、第一作者论文数、期刊数量、会议数量、影响因子和、H指数中的至少一种;合作属性数据包括合作者姓名、合作者工作单位、合作论文数、排序靠前数、排序靠后数中的至少一种;社交属性数据包括另一专家姓名、另一专家工作单位、师生关系中的至少一种。5.如权利要求1所述的方法,其特征在于:所述步骤S3中具体包括如下步骤:S301:根据学术属性数据构建领域专家学术属性语义关系网络:提取学术属性数据,将领域专家作为头实体,属性名称作为语义关系,属性值作为尾实体,形成学术属性语义关系网络;S302:根据合作属性数据构建领域专家合作属性语义关系网络:提取合作属性数据,将领域专家作为头实体,合作信息作为语义关系,合作者作为尾实体,形成合作属性语义关系网络;S303:根据社交属性数据构建领域专家社交属性语义关系网络:提取社交属性数据,将领域专家作为头实体,师生关系作为语义关系,另一专家作为尾实体,形成社交属性语义关系网络。6.如权利要求5所述的方法,其特征在于:所述合作信息包括合作论文数、排序靠前数、排序靠后数中的至少一种;所述师生关系包括博士导师、硕士导师、博士生和硕士生这四种关系中的至少一种。7.如权利要求1所述的方法,其特征在于:所述步骤S4中具体包括如下步骤:S401:考虑时间衰减因素,构建领域专家学术属性影响关系网络;S402:考虑时间衰减因素,构建领域专家合作属性影响关系网络;S403:构建领域专家社交属性影响关系网络。8.如权利要求7所述的方法,其特征在于:所述步骤S401具体包括:学术属性影响关系考虑3个因素:论文总数,影响因子和,H指数,并将衰减时间划分为3段:3年以内,3年至10年之内,10年以上;
假设共有N位领域专家,在第t个时间段内第i个专家的第k个因素取值为其中i=1,2,...,N;k=1,2,3;t=1,2,3;k=1表示论文总数,k=2表示影响因子和,k=3表示H指数;t=1表示3年以内,t=2表示3年至10年之内,t=3表示10年以上;则在第t个时间段内第i位专家与第j位专家的第k个因素取值之差为学术属性直接影响值响值在每个学术属...
【专利技术属性】
技术研发人员:龚光红,邹雅芳,宋晓,王江云,苑海涛,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。