当前位置: 首页 > 专利查询>清华大学专利>正文

一种基于群组匹配的专家推荐方法及系统技术方案

技术编号:11062111 阅读:173 留言:0更新日期:2015-02-19 09:09
本发明专利技术公开了一种基于群组匹配的专家推荐方法及系统,属于互联网技术领域,所述方法包括:S1:通过网络爬虫获取专家列表中各专家的网页信息;S2:对所述网页信息进行提取,以获得各专家的专家学术信息;S3:根据所述专家学术信息计算各专家与待匹配项目之间的匹配度;S4:根据所述匹配度及群组匹配模型通过动态规划算法确定为所述待匹配项目所推荐的专家。本发明专利技术通过群组匹配的方式实现专家推荐,提高了专家推荐效率,大幅降低时间开销,另外,计算各专家与待匹配项目之间的匹配度时,还考虑了各专家与待匹配项目之间的社会关系匹配度,从而在实现专家推荐时,还有效避免或预防了学术腐败问题。

【技术实现步骤摘要】
一种基于群组匹配的专家推荐方法及系统
本专利技术涉及互联网
,特别涉及一种基于群组匹配的专家推荐方法及系 统。
技术介绍
科研项目的评审效率和评审质量对一个单位甚至一个国家的科研发展水平有重 要影响。作为一种快捷、先进的评审方式,网络评审贯穿一个科研或工程项目从立项、申请、 组织、论证、评估、验收、奖励到备案等各个阶段的全生命周期,其宗旨是利用计算机和网络 系统替代传统的人工操作,从而低评审成本、提高工作效率和评审质量,并利用电子信息系 统来规范评审过程。 近年来,云计算、大数据、推荐系统、深度学习、社会网络等新型信息技术的迅速发 展使得智能化的网络评审成为可能,其中智能化的专家推荐系统是整个网络评审过程的核 心与难点。这里智能化的含义是:系统不仅能对内部信息(基于代码、精确化、结构化)进 行处理和提炼,还能不断汇聚外部信息(基于语义、模糊化、非结构化),通过数据积累对专 家本身进行分类和评价,生成更具指导意义的智能专家库,从而构造更为合理的推荐模型 和算法,但现有的专家推荐系统存在专家推荐效率过低的问题,导致时间开销过大。
技术实现思路
鉴于上述问题,本专利技术提供了一种基于群组匹配的专家推荐方法,所述方法包 括: Sl :通过网络爬虫获取专家列表中各专家的网页信息; S2 :对所述网页信息进行提取,以获得各专家的专家学术信息; S3 :根据所述专家学术信息计算各专家与待匹配项目之间的匹配度; S4 :根据所述匹配度及群组匹配模型通过动态规划算法确定为所述待匹配项目所 推荐的专家,所述群组匹配模型为所有待匹配项目推荐专家的匹配度之和达到最大时,所 述待匹配项目和推荐的专家之间的对应关系。 其中,步骤Sl中,根据所述专家列表中的专家姓名通过网络爬虫获取专家列表中 各专家的网页信息。 其中,步骤S2具体包括: S201 :从所述网页信息中搜索与当前专家的专家姓名及工作单位相匹配的网页信 息,若未搜索到,则执行步骤S202,否则从搜索到的第一个网页信息中提取出专家学术信 息,并执行步骤S203,所述专家列表包括:各专家的专家姓名及工作单位; S202:从所述网页信息中搜索与当前专家的专家姓名相匹配的网页信息,从搜索 到的第一个网页信息中提取专家学术信息; S203 :将所述专家列表中未提取专家学术信息的专家作为当前专家,并返回步骤 S201。 其中,所述专家学术信息包括:专家姓名、工作单位、研究领域关键词、论文名称及 论文作者。 其中,步骤S3中,根据所述专家学术信息通过下式计算各专家与待匹配项目之间 的匹配度, Mi,』=a *MKi,』+ β *MJi,』+ Y *MLi,j- δ *MSi,』 其中,Mi;j为专家i与待匹配项目j之间的匹配度,α、β、Y、δ均为常数,MKy 为专家i与待匹配项目j之间的科研领域关键词匹配度,MJu为专家i与待匹配项目j之 间的期刊会议标签匹配度,MLu为专家i与待匹配项目j之间的学术层次匹配度,MSu为 专家i与待匹配项目j之间的社会关系匹配度。 其中,所述MSi,」通过下式进行计算,本文档来自技高网...
一种基于群组匹配的专家推荐方法及系统

【技术保护点】
一种基于群组匹配的专家推荐方法,其特征在于,所述方法包括:S1:通过网络爬虫获取专家列表中各专家的网页信息;S2:对所述网页信息进行提取,以获得各专家的专家学术信息;S3:根据所述专家学术信息计算各专家与待匹配项目之间的匹配度;S4:根据所述匹配度及群组匹配模型通过动态规划算法确定为所述待匹配项目所推荐的专家,所述群组匹配模型为所有待匹配项目推荐专家的匹配度之和达到最大时,所述待匹配项目和推荐的专家之间的对应关系。

【技术特征摘要】
1. 一种基于群组匹配的专家推荐方法,其特征在于,所述方法包括: 51 :通过网络爬虫获取专家列表中各专家的网页信息; 52 :对所述网页信息进行提取,以获得各专家的专家学术信息; 53 :根据所述专家学术信息计算各专家与待匹配项目之间的匹配度; 54 :根据所述匹配度及群组匹配模型通过动态规划算法确定为所述待匹配项目所推荐 的专家,所述群组匹配模型为所有待匹配项目推荐专家的匹配度之和达到最大时,所述待 匹配项目和推荐的专家之间的对应关系。2. 如权利要求1所述的方法,其特征在于,步骤Sl中,根据所述专家列表中的专家姓名 通过网络爬虫获取专家列表中各专家的网页信息。3. 如权利要求2所述的方法,其特征在于,步骤S2具体包括: 5201 :从所述网页信息中搜索与当前专家的专家姓名及工作单位相匹配的网页信息, 若未搜索到,则执行步骤S202,否则从搜索到的第一个网页信息中提取出专家学术信息,并 执行步骤S203,所述专家列表包括:各专家的专家姓名及工作单位; 5202 :从所述网页信息中搜索与当前专家的专家姓名相匹配的网页信息,从搜索到的 第一个网页信息中提取专家学术信息; S203:将所述专家列表中未提取专家学术信息的专家作为当前专家,并返回步骤 S201。4. 如权利要求3所述的方法,其特征在于,所述专家学术信息包括:专家姓名、工作单 位、研究领域关键词、论文名称及论文作者。5. 如权利要求4所述的方法,其特征在于,步骤S3中,根据所述专家学术信息通过下式 计算各专家与待匹配项目之间的匹配度, Mi; j = a *MKi; j+ ^ *MJi; j+ y *MLi; r 8 *MSi; j 其中,My为专家i与待匹配项目j之间的匹配度,a、3、Y、S均为常数,MKu为专 家i与待匹配项目j之间的科研领域关键词匹配度,MJu为专家i与待匹配项目j之间的 期刊会议标签匹...

【专利技术属性】
技术研发人员:肖贺李振华刘云浩
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1