一种面向技术领域的专业人才搜索方法技术

技术编号:19342444 阅读:34 留言:0更新日期:2018-11-07 13:59
本发明专利技术公开了一种面向技术领域的专业人才搜索方法。本发明专利技术首先对海量科技成果数据资源进行文本处理和知识挖掘,生成技术领域词库和对应的词向量库。然后构建人才‑技术领域专业能力模型:对科技成果所属技术领域进行智能化标注并生成人才与技术领域的关系;综合科技成果的质量评分、人才贡献度、技术领域偏重度,构建人才‑技术领域专业能力模型。最后根据步骤2中的人才‑技术领域专业能力模型,计算得到所有人才在各技术领域的专业能力评分,生成相应索引文件并部署实现面向技术领域的专业人才搜索引擎。本发明专利技术基于大数据实现人才‑技术领域专业能力评分的智能计算,面向技术领域进行人才搜索比较便捷高效,排序结果比较科学合理。

A search method for professionals in the field of Technology

The invention discloses a search method for professionals in the field of technology. The invention firstly carries out text processing and knowledge mining on massive data resources of scientific and technological achievements, and generates technical domain lexicon and corresponding lexical vector library. Then it builds the model of professional competence in the field of talents and technology: intellectualize the technical field of scientific and technological achievements and generate the relationship between talents and technological fields; synthesize the quality score of scientific and technological achievements, the contribution degree of talents and the emphasis of technological fields, and construct the model of professional competence in the field of talents and technology. Finally, according to the talent-technical domain professional competence model in step 2, the professional competence scores of all talents in various technical fields are calculated, the corresponding index files are generated and the professional search engine oriented to the technical domain is deployed. The invention realizes the intelligent calculation of the professional ability score in the technical field based on big data, makes the talent search facing the technical field more convenient and efficient, and the ranking result is more scientific and reasonable.

【技术实现步骤摘要】
一种面向
的专业人才搜索方法
本专利技术涉及搜索引擎
,特别是涉及一种面向
的专业人才搜索方法。
技术介绍
人才是第一资源,企业在创新过程中对专业技术人才求贤若渴。虽然高校院所等科研机构拥有大量的技术人才,但是由于科技信息“不对称”、缺乏科技大数据和智能搜索技术,企业往往缺少有效途径快速找到特定
的专业人才。目前一些所谓的人才库或专家库系统只是收集了有限的人才及其
描述信息,很多信息描述是主观填写的,不能客观反映人才的专业能力情况,不能满足根据特定
精准有效搜索匹配专业人才的需求。随着大数据与人工智能技术的兴起,科技成果数据资源的开发和利用将有效解决上述的这些问题。本专利技术中的科技成果指的是学术论文、专利、科研项目三大类,这些科技成果数据信息包含成果类型、名称、成员、关键词、摘要、全文描述等文本信息。2016年5月,国务院办公厅印发的《促进科技成果转移转化行动方案》,明确鼓励运用云计算、大数据等新一代信息技术,加强科技成果数据资源的开发利用,提供符合用户需求的精准科技成果信息。因此,针对海量科技成果数据资源进行分析处理,实现智能化的
人才搜索方法与系统是非常必要和有意义的。
技术实现思路
本专利技术的目的在于利用科技人才及其学术论文、专利和科研项目等客观存在的科技成果数据资源,通过自然语言处理和机器学习等技术生成
词库和词向量库、构建人才-
专业能力模型,并实现面向
的专业人才搜索方法。本专利技术方法包括以下步骤:步骤1:生成
词库和词向量库利用自然语言处理与机器学习技术,对海量科技成果数据资源进行文本处理、
词识别,形成
词库T,同时通过词向量训练得到对应的词向量库A;对每一个
词ti∈T,都有且只有一个对应的词向量ai∈A。步骤2:构建人才-
专业能力模型步骤2.1:生成人才-
关系通过对海量科技成果数据资源进行文本处理,实现科技成果所属
的智能化标注,进而得到人才与科技成果的关联、人才与
的关联关系。步骤2.2:计算科技成果的质量评分Spaper、Spatent和Sproject分别表示学术论文、专利、科研项目三种类型科技成果的评分模型,其表达式如下:Spaper=log(k·dc+10)·grade(dr)Spatent=patentType(da)Sproject=fund(db)·projectType(de)其中,dc为论文被引用次数,k为调节因子,调节论文引用次数对于分值的影响,dr为论文发表期刊的等级,grade(dr)表示对应论文期刊等级的常数影响值;da表示专利类型,patentType(da)为不同专利类型对应的常数影响值;db和de分别为项目经费和项目类别,fund(db)和projectType(de)分别为项目经费和项目类别对项目质量的影响值。步骤2.3:计算科技成果的人才贡献度科技成果的人才贡献度C,用正比例函数来表示其排名与贡献程度的关系:其中,m表示人才在该科技成果中的排名,即第几成员,1≤m≤4。步骤2.4:计算科技成果的
偏重度使用相关
词向量的加权平均来表示科技成果的主题向量,该主题向量与
词向量的归一化余弦相似度,即为该科技成果的
偏重度;为科技成果k的主题向量,设tki为科技成果k中的第i个
词,aki为对应的词向量,tki∈T,aki∈A,xki为tki在科技成果k中出现的词频,n表示科技成果k中包含的
词总数量,xk为上式中的xki之和;Wki表示科技成果k对于tki的
偏重度,通过计算词向量aki与主题向量的归一化余弦相似度得到;将tki用tf表示,tf∈T,tf表示T中第f个
词,则对应的aki表示为af,Wki表示为W′kf,则得到下式步骤2.5:构建人才-
专业能力模型将科技成果的质量评分、人才贡献度和
偏重度三者相乘,计算得到人才就参与该科技成果的
专业能力分值;人才-
专业能力是该人才所参与的各相关科技成果的
专业能力分值之和,人才-
专业能力模型如下:其中,Vpf表示人才p对于
tf的专业能力,k代表该人才p参与的第几项科技成果,Sk为科技成果k的质量评分,Cpk为该人才p在科技成果k中的贡献度。科技成果k是学术论文、专利或科研项目,Sk表示如下:其中,α、β和γ则分别是学术论文、专利或科研项目三种类型科技成果质量权重的调节因子,三者的取值范围为[0,1],其和为1。步骤3:生成索引文件实现搜索引擎根据步骤2中的人才-
专业能力模型进行计算得到所有人才在各
的专业能力评分,生成相应索引文件并部署实现搜索引擎;用户在搜索框中输入
词,即可搜索得到该
专业能力从高到低排序的人才列表。与现有技术相比,本专利技术有如下优点:本专利技术通过对海量科技成果数据资源的文本处理和知识挖掘,生成
词库和语义词向量;实现科技成果所属
的智能化标注,并得到人才与
的关系;综合科技成果的质量评分、人才贡献度、
偏重度,构建了人才-
专业能力模型;有效实现了一种面向
的专业人才搜索排序方法和系统。附图说明图1是本专利技术的流程图。图2是人才-
专业能力关联图。具体实施方式以下结合附图1对本专利技术作进一步说明:本专利技术的具体步骤是:1.生成
词库和词向量库利用自然语言处理与机器学习技术,对海量科技成果数据资源进行文本处理、
词识别等知识挖掘,形成
词库T,同时通过词向量训练得到对应的词向量库A。对每一个
词ti∈T,都有且只有一个对应的词向量ai∈A。2.构建人才-
专业能力模型人才针对特定
的专业能力,与人才-
的关系、科技成果的质量评分、人才贡献度和
偏重度有关,下面介绍人才-
专业能力模型的构建,见图2。2.1生成人才-
关系通过对海量科技成果数据资源进行文本处理,实现科技成果所属
的智能化标注,进而得到人才与科技成果以及人才与
的关联关系。2.2计算科技成果的质量评分要衡量人才的能力水平,首先需要计算该人才所参与的科技成果的质量,所以需要一种评分模型对所有科技成果进行打分。本专利技术以Spaper、Spatent和Sproject来分别表示学术论文、专利、科研项目三种类型科技成果的评分模型,表达式如下:Spaper=log(k·dc+10)·grade(dr)Spatent=patentType(da)Sproject=fund(db)·projectType(de)其中,dc为论文被引用次数,k为调节因子,调节论文引用次数对于分值的影响,dr为论文发表期刊的等级,grade(dr)表示对应论文期刊等级的常数影响值。da表示专利类型,patentType(da)为不同专利类型对应的常数影响值。db和de分别为项目经费和项目类别,fund(db)和projectType(de)分别为项目经费和项目类别对项目质量的影响值。2.3计算科技成果的人才贡献度对于特定科技成果的所有参与成员,一般来说排名越靠前的成员对该科技成果的贡献度越高。科技成果的人才贡献度C,本文档来自技高网
...

【技术保护点】
1.一种面向技术领域的专业人才搜索方法,其特征在于,该方法包含如下步骤:步骤1:生成技术领域词库和词向量库利用自然语言处理与机器学习技术,对海量科技成果数据资源进行文本处理、技术领域词识别,形成技术领域词库T,同时通过词向量训练得到对应的词向量库A;对每一个技术领域词ti∈T,都有且只有一个对应的词向量ai∈A。;步骤2:构建人才‑技术领域专业能力模型步骤2.1:生成人才‑技术领域关系通过对海量科技成果数据资源进行文本处理,实现科技成果所属技术领域的智能化标注,进而得到人才与科技成果的关联、人才与技术领域的关联关系;步骤2.2:计算科技成果的质量评分Spaper、Spatent和Sproject分别表示学术论文、专利、科研项目三种类型科技成果的评分模型,其表达式如下:Spaper=log(k·dc+10)·grade(dr)Spatent=patentType(da)Sproject=fund(db)·projectType(de)其中,dc为论文被引用次数,k为调节因子,调节论文引用次数对于分值的影响,dr为论文发表期刊的等级,grade(dr)表示对应论文期刊等级的常数影响值;da表示专利类型,patentType(da)为不同专利类型对应的常数影响值;db和de分别为项目经费和项目类别,fund(db)和projectType(de)分别为项目经费和项目类别对项目质量的影响值;步骤2.3:计算科技成果的人才贡献度科技成果的人才贡献度C,用正比例函数来表示其排名与贡献程度的关系:...

【技术特征摘要】
1.一种面向技术领域的专业人才搜索方法,其特征在于,该方法包含如下步骤:步骤1:生成技术领域词库和词向量库利用自然语言处理与机器学习技术,对海量科技成果数据资源进行文本处理、技术领域词识别,形成技术领域词库T,同时通过词向量训练得到对应的词向量库A;对每一个技术领域词ti∈T,都有且只有一个对应的词向量ai∈A。;步骤2:构建人才-技术领域专业能力模型步骤2.1:生成人才-技术领域关系通过对海量科技成果数据资源进行文本处理,实现科技成果所属技术领域的智能化标注,进而得到人才与科技成果的关联、人才与技术领域的关联关系;步骤2.2:计算科技成果的质量评分Spaper、Spatent和Sproject分别表示学术论文、专利、科研项目三种类型科技成果的评分模型,其表达式如下:Spaper=log(k·dc+10)·grade(dr)Spatent=patentType(da)Sproject=fund(db)·projectType(de)其中,dc为论文被引用次数,k为调节因子,调节论文引用次数对于分值的影响,dr为论文发表期刊的等级,grade(dr)表示对应论文期刊等级的常数影响值;da表示专利类型,patentType(da)为不同专利类型对应的常数影响值;db和de分别为项目经费和项目类别,fund(db)和projectType(de)分别为项目经费和项目类别对项目质量的影响值;步骤2.3:计算科技成果的人才贡献度科技成果的人才贡献度C,用正比例函数来表示其排名与贡献程度的关系:其中,m表示人才在该科技成果中的排名,即第几成员,1≤m≤4,排名靠后的成员;步骤2.4:计算科技成果的技术领域偏重度...

【专利技术属性】
技术研发人员:徐小良顾高飞
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1