【技术实现步骤摘要】
一种基于技术主题识别的科研合作机构推荐方法、装置及存储介质
[0001]本专利技术属于数据挖掘
,具体地说,涉及一种基于技术主题识别的科研合作机构推荐方法、装置及存储介质。
技术介绍
[0002]随着社会的不断发展进步,开放式创新成为热门话题,合作创新成为创新主体实现资源互补、提高创新效率、降低新品开发成本的最优选择。企业、高校、科研院所、政府机构或者社会组织参与合作创新,逐渐形成产学研合作、高等院校合作、校企合作、产业联盟合作、科研机构合作等组织形式的创新合作网络。然而,由于资源的稀缺性与有限性,寻找研究领域相近、有意向合作的伙伴机构变得越来越困难。
[0003]目前对于合作伙伴的推荐方法包括基于未来共同邻居相似性的合作伙伴推荐方法,该方法根据企业在供应链网络中连接关系计算待推荐节点和待考察节点与包括待推荐节点、待考察节点、未来共同邻居节点的所有节点之间的相似度,从而得出待推荐节点与待考察之间的合作最终分数,以提高推荐结果的准确性。然而,供应链网络是在产品生产和流通过程中形成的,网络节点包括原材料供应商、生产 ...
【技术保护点】
【技术特征摘要】
1.一种基于技术主题识别的科研合作机构推荐方法,其特征在于,包括:获取目标科研机构的研发活动范围;基于所述研发活动范围,生成主题分类词;基于对所述主题分类词检索生成的文献数据集,标记文献数据对应的前沿技术;提取从事所述前沿技术的创新主体的数据信息,建立创新主体数据集;通过计算所述创新主体数据集中创新主体的推荐评分,确定所述目标科研机构的合作机构。2.根据权利要求1所述的基于技术主题识别的科研合作机构推荐方法,其特征在于,所述基于所述研发活动范围,生成主题分类词的方法,包括:基于获取的目标科研机构的研发活动范围,生成技术分解表,其中,所述技术分解表至少包括第一技术分支和第二技术分支;根据所述技术分解表的分支,确定所述主题分类词。3.根据权利要求2所述的基于技术主题识别的科研合作机构推荐方法,其特征在于,所述标记文献数据对应的前沿技术的方法,包括:统计所述文献数据集中技术主题词的比重,得到所述技术主题词的第一词频,其中,所述技术主题词包括所述主题分类词;根据预设的频率阈值,通过比较所述第一频率与所述频率阈值的大小,确定高频技术主题词;基于所述高频技术主题词的共现关系,构建高频技术主题词共现网络,并总结高频技术主题词词簇的特征;将同一词簇的高频技术主题词确定为一个前沿技术主题,形成所述前沿技术主题清单;根据TF
‑
IDF算法计算所述前沿技术主题清单中的前沿技术主题在所述文献数据集中的比重,得到所述前沿技术主题的第二词频;基于所述第二词频,标记文献数据对应的前沿技术。4.根据权利要求3所述的基于技术主题识别的科研合作机构推荐方法,其特征在于,所述建立创新主体数据集的方法,包括:根据对所述前沿技术的标记,提取创新主体信息,其中,所述创新主体信息至少包括:创新主体的范围信息、创新主体数据集的字段信息、创新主体的评价指标信息等;依据所述创新主体信息,建立创新主体数据集。5.根据权利要求1
‑
4任一项所述的基于技术主题识别的科研合作机构推荐方法,其特征在于,所述确定所述目标科研机构的合作机构的方法,包括:获取提前预设的所述创新主体的评价指标权重;基于所述指标权重,计算所述创新主体的推荐评分;对所述推荐评分进行降序排列,得到合作机构列表,并确定所述目标科研机构的合作机构。6.根据权利要求5所述的基于技术主题识别的科研合作机构推荐方法,其特征在于,所述创新主体的评价指标的确定方法,包括:
...
【专利技术属性】
技术研发人员:刘静,胥彦玲,刘宇,凡庆涛,
申请(专利权)人:北京市科学技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。