【技术实现步骤摘要】
一种科研项目评审专家精准推荐方法和存储设备
本专利技术涉及数据处理
,特别涉及一种科研项目评审专家精准推荐方法和存储设备。
技术介绍
2002年,Kreiner等人提出同行评审环节中,那些难以被编纂、直接表达出来的隐性知识是无法被复制、取代的,所以评审专家在学术文献中的重要作用无可取代。因此,基于计算机庞大算力,为各学科科研项目寻找合适的评审专家已逐渐成为国际专家评审推荐工作的主流趋势。公开号为US20110184926A1的美国专利通过分析专家库中专家与各个关键词之间的语义相关性,实现生成输入提案的对应领域推荐专家列表。公开号为US20110184926A1的美国专利在进行关键词关联与学者学科定位时,主要是基于维基百科下的学科层次分布对关键词进行关联度分析,缺少对于各个专家文本的实际分析考察,由此对专家进行学科领域分类还存在一定不确定性,存在针对小领域专家推荐不精准的可能性。公开号为CN110909236A的中国专利通过建立专家数据库,对专家信息进行分析建模,实现根据具体项目需求调配对应学科专家,实现“基于大数据的专家推荐方法”。公开号为CN110909236A的中国专利,该方法的缺陷在于其主要关注的是被推荐专家的职称与其在实际评审中的工作经验,在大科学时代背景下需要根据细分学科、交叉学科项目特点,精准推荐小领域专家,这是此方法目前还较为欠缺的地方。
技术实现思路
为此,需要提供一种科研项目评审专家精准推荐方法,用以解决现有技术中小领域专家推荐不精准的问题。具体技术方案如下 ...
【技术保护点】
1.一种科研项目评审专家精准推荐方法,其特征在于,包括步骤:/n构建关键词词库,并计算生成各关键词与各学科的对应关系;/n获取目标文件,对所述目标文件进行预处理操作;/n对所述目标文件进行分节处理,并确定各分节的关键词;/n确定各分节的各关键词权重,根据所述各分节的各关键词权重确定各分节的学科分布,整合所述各分节的学科分布得整个目标文件的学科分布;/n在所述整个目标文件的学科分布内确定最相似的专家;/n将所述最相似的专家进行展示。/n
【技术特征摘要】
1.一种科研项目评审专家精准推荐方法,其特征在于,包括步骤:
构建关键词词库,并计算生成各关键词与各学科的对应关系;
获取目标文件,对所述目标文件进行预处理操作;
对所述目标文件进行分节处理,并确定各分节的关键词;
确定各分节的各关键词权重,根据所述各分节的各关键词权重确定各分节的学科分布,整合所述各分节的学科分布得整个目标文件的学科分布;
在所述整个目标文件的学科分布内确定最相似的专家;
将所述最相似的专家进行展示。
2.根据权利要求1所述的一种科研项目评审专家精准推荐方法,其特征在于,所述“并计算生成各关键词与各学科的对应关系”,具体还包括步骤:
对于专家库中的每位专家,生成关键词-学科共现矩阵Ck:
Cki,j=|{D|wi∈D,dj∈D}|,k=1,2,3
其中k为学科级别,w为关键词,D是这位专家所写的文章,d为学科;
对于每个关键词,根据以下公式计算得出这个词对于所有学科的共现系数:
式子中,p为共现矩阵元素的值,即特定关键词wi在特定学科dj中出现的概率,f为两个目标对象di和wi共现的次数。
3.根据权利要求1所述的一种科研项目评审专家精准推荐方法,其特征在于,所述“对所述目标文件进行预处理操作”,具体还包括步骤:
通过IF-IDF加权技术对所述目标文件进行预处理操作。
4.根据权利要求1所述的一种科研项目评审专家精准推荐方法,其特征在于,所述“并确定各分节的关键词”,具体还包括步骤:
根据预设算法抽取初步关键词,并根据预先建立好的关键词网对所述初步关键词进行去噪确定各分节最终对应的关键词。
5.根据权利要求1所述的一种科研项目评审专家精准推荐方法,其特征在于,所述“在所述整个目标文件的学科分布内确定最相似的专家”,具体还包括步骤:
在学科内根据预设数值K选取对应数值专家,将每个抽取出的关键词进行向量化,对所有向量进行平均化得目标文件的向量;
对每位专家的所有扩充关键词进行向量化,根据所述目标文件的向量与所述每位专家的扩充关键词的向量在向量空间内的余弦相似度确定最相似的专家。
...
【专利技术属性】
技术研发人员:石宝玉,黄丽丽,游河仁,姚智振,
申请(专利权)人:福州数据技术研究院有限公司,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。