The present invention relates to a method and device for establishing a database of experts, the method comprises the following steps: sample collection procedures, sample collection experts in specific fields, including expert papers, patents and projects, the formation of the training set; step to establish the expert classification model based on expert classification model training base; direct expert recognition steps, using the expert classification the model for the identification and classification of all classification experts, to determine whether it belongs to the domain of experts; cooperation experts identify steps, according to the experts to be classified with the experts in specific areas of cooperation to determine the expert classification experts whether belonging to the special field.
【技术实现步骤摘要】
专家库建立办法和装置
本专利技术涉及专家库的建立。
技术介绍
专家是特定领域有卓越表现和高度专业能力的个人。一方面,专家可以在科技项目开发中起到重要的作用,另一方面,很多评审等活动需要专家的参与,例如招标等。实际上,2003年发改委还专门制定了《评标专家和评标专家库管理暂行办法》。但是目前所建立的专家数据库要么局限在人员手工的收集,要么是专家自己的报名。现有技术中,没有好的办法根据大量的信息(例如互联网信息)或大的总库中寻找特定专家的办法。
技术实现思路
本专利技术针对现有技术的以上缺点做出,用以克服现有技术的一个或更多个缺点,至少提供一种有益的选择。根据本专利技术的一个方面,提供了一种专家库建立方法,包括以下步骤:样本收集步骤,收集特定领域的专家样本,包括专家的论文、专利和项目,形成训练集;专家分类模型建立步骤,根据训练库建立专家模型;直接专家识别步骤,利用所建立的专家模型,对全部待分类专家进行识别和分类,判断其是否属于所述特定领域的专家;合作专家识别步骤,根据待分类专家与所述特定领域的专家的合作度确定待分类专家是否属于领域专家。根据本专利技术的另一方面,提供了一种专家库建立装置,包括:专家样本收集装置,收集特定领域的专家样本,包括专家的论文、专利和项目,形成训练集;专家分类模型建立装置,根据训练库建立专家分类模型;直接专家识别装置,利用所建立的专家分类模型,对全部待分类专家进行识别和分类,判断其是否属于所述特定领域的专家;合作专家识别装置,根据待分类专家与所述特定领域的专家的合作度确定待分类专家是否属于所述特定领域的专家。根据本专利技术的实施方式,可以快速 ...
【技术保护点】
一种专家库建立方法,包括以下步骤:专家样本收集步骤,收集特定领域的专家样本,包括专家的论文、专利和项目,形成训练集;专家分类模型建立步骤,根据训练库建立专家分类模型;直接专家识别步骤,利用所建立的专家分类模型,对全部待分类专家进行识别和分类,判断其是否属于所述特定领域的专家;合作专家识别步骤,根据待分类专家与所述特定领域的专家的合作度确定待分类专家是否属于所述特定领域的专家。
【技术特征摘要】
1.一种专家库建立方法,包括以下步骤:专家样本收集步骤,收集特定领域的专家样本,包括专家的论文、专利和项目,形成训练集;专家分类模型建立步骤,根据训练库建立专家分类模型;直接专家识别步骤,利用所建立的专家分类模型,对全部待分类专家进行识别和分类,判断其是否属于所述特定领域的专家;合作专家识别步骤,根据待分类专家与所述特定领域的专家的合作度确定待分类专家是否属于所述特定领域的专家。2.根据权利要求1所述的专家库建立方法,其特征在于,在所述专家样本收集步骤,还形成测试集,所述专家分类模型建立步骤还包括使用所述测试集对所述专家分类模型进行测试和修正。3.根据权利要求2所述的专家库建立方法,其特征在于,所述合作专家识别步骤包括:一度合作者确定步骤,确定已识别出的所述特定领域专家中与待分类专家为一度合作者的专家,一度合作的论文、专利、项目以及其数量,即一度合作次数;一度合作权重系数确定步骤,针对各一度合作者,根据所述一度合作的论文、专利、项目以及所述一度合作次数,确定各一度合作者的权重系数;二度合作者确定步骤,确定已识别出的所述特定领域专家中与待分类专家为二度合作者的专家,二度合作的论文、专利、项目以及其数量,即二度合作次数;二度合作权重系数确定步骤,针对各二度合作者,根据所述一度合作的论文、专利、项目以及所述二度合作次数,所述二度合作的论文、专利、项目以及所述合作次数确定各二度合作者的权重系数;合作度计算步骤,根据各所述一度合作者的权重系数和各所述二度合作者的权重系数计算各待分类专家与所述特定领域的专家的合作度。4.根据权利要求3所述的专家库建立方法,其特征在于,在所述一度合作权重系数确定步骤中,根据合作次数确定一度合作权重系数j1,合作的次数越多,一度合作权重系数j1越大,还根据合作的论文、专利、项目的质量调整各次合作权重系数,即计算所合作的论文、专利、项目与专家分类模型之间的距离,距离越小,该次一度合作权重系数越大。5.根据权利要求4所述的专家库建立方法,其特征在于,在所述二度合作权重系数确定步骤中,二次合作的次数越多,二度合作权重系数j2越大,还根据一度合作的论文、专利、项目的质量、二度合作论文的质量调整每次二度合作的二次合作权重系数。6.根据权利要求5所述的专家库建立方法,其特征在于,在所述二度合作权重系数确定步骤中,计算一度合作的论文、专利、项目与专家分类模型之间的距离,以及该二度合作的论文、专利、项目与专家分类模型之间的距离,并计算综合距离,距离越小,则该次二度合作权重系数越大,综合距离为考虑一度合作论文的权重调节系数和二度合作论文的权重调节系数之后得到的距离。7.根据权利要求6所...
【专利技术属性】
技术研发人员:霍东云,崔星汉,方垚,李燕茜,
申请(专利权)人:北京赛时科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。