The invention discloses a search method for professionals in the field of technology. The invention firstly carries out text processing and knowledge mining on massive data resources of scientific and technological achievements, and generates technical domain lexicon and corresponding lexical vector library. Then it builds the model of professional competence in the field of talents and technology: intellectualize the technical field of scientific and technological achievements and generate the relationship between talents and technological fields; synthesize the quality score of scientific and technological achievements, the contribution degree of talents and the emphasis of technological fields, and construct the model of professional competence in the field of talents and technology. Finally, according to the talent-technical domain professional competence model in step 2, the professional competence scores of all talents in various technical fields are calculated, the corresponding index files are generated and the professional search engine oriented to the technical domain is deployed. The invention realizes the intelligent calculation of the professional ability score in the technical field based on big data, makes the talent search facing the technical field more convenient and efficient, and the ranking result is more scientific and reasonable.
【技术实现步骤摘要】
一种面向
的专业人才搜索方法
本专利技术涉及搜索引擎
,特别是涉及一种面向
的专业人才搜索方法。
技术介绍
人才是第一资源,企业在创新过程中对专业技术人才求贤若渴。虽然高校院所等科研机构拥有大量的技术人才,但是由于科技信息“不对称”、缺乏科技大数据和智能搜索技术,企业往往缺少有效途径快速找到特定
的专业人才。目前一些所谓的人才库或专家库系统只是收集了有限的人才及其
描述信息,很多信息描述是主观填写的,不能客观反映人才的专业能力情况,不能满足根据特定
精准有效搜索匹配专业人才的需求。随着大数据与人工智能技术的兴起,科技成果数据资源的开发和利用将有效解决上述的这些问题。本专利技术中的科技成果指的是学术论文、专利、科研项目三大类,这些科技成果数据信息包含成果类型、名称、成员、关键词、摘要、全文描述等文本信息。2016年5月,国务院办公厅印发的《促进科技成果转移转化行动方案》,明确鼓励运用云计算、大数据等新一代信息技术,加强科技成果数据资源的开发利用,提供符合用户需求的精准科技成果信息。因此,针对海量科技成果数据资源进行分析处理,实现智能化的
人才搜索方法与系统是非常必要和有意义的。
技术实现思路
本专利技术的目的在于利用科技人才及其学术论文、专利和科研项目等客观存在的科技成果数据资源,通过自然语言处理和机器学习等技术生成
词库和词向量库、构建人才-
专业能力模型,并实现面向
的专业人才搜索方法。本专利技术方法包括以下步骤:步骤1:生成
词库和词向量库利用自然语言处理与机器学习技术,对海量科技成果数据资 ...
【技术保护点】
1.一种面向技术领域的专业人才搜索方法,其特征在于,该方法包含如下步骤:步骤1:生成技术领域词库和词向量库利用自然语言处理与机器学习技术,对海量科技成果数据资源进行文本处理、技术领域词识别,形成技术领域词库T,同时通过词向量训练得到对应的词向量库A;对每一个技术领域词ti∈T,都有且只有一个对应的词向量ai∈A。;步骤2:构建人才‑技术领域专业能力模型步骤2.1:生成人才‑技术领域关系通过对海量科技成果数据资源进行文本处理,实现科技成果所属技术领域的智能化标注,进而得到人才与科技成果的关联、人才与技术领域的关联关系;步骤2.2:计算科技成果的质量评分Spaper、Spatent和Sproject分别表示学术论文、专利、科研项目三种类型科技成果的评分模型,其表达式如下:Spaper=log(k·dc+10)·grade(dr)Spatent=patentType(da)Sproject=fund(db)·projectType(de)其中,dc为论文被引用次数,k为调节因子,调节论文引用次数对于分值的影响,dr为论文发表期刊的等级,grade(dr)表示对应论文期刊等级的常数影响值;da ...
【技术特征摘要】
1.一种面向技术领域的专业人才搜索方法,其特征在于,该方法包含如下步骤:步骤1:生成技术领域词库和词向量库利用自然语言处理与机器学习技术,对海量科技成果数据资源进行文本处理、技术领域词识别,形成技术领域词库T,同时通过词向量训练得到对应的词向量库A;对每一个技术领域词ti∈T,都有且只有一个对应的词向量ai∈A。;步骤2:构建人才-技术领域专业能力模型步骤2.1:生成人才-技术领域关系通过对海量科技成果数据资源进行文本处理,实现科技成果所属技术领域的智能化标注,进而得到人才与科技成果的关联、人才与技术领域的关联关系;步骤2.2:计算科技成果的质量评分Spaper、Spatent和Sproject分别表示学术论文、专利、科研项目三种类型科技成果的评分模型,其表达式如下:Spaper=log(k·dc+10)·grade(dr)Spatent=patentType(da)Sproject=fund(db)·projectType(de)其中,dc为论文被引用次数,k为调节因子,调节论文引用次数对于分值的影响,dr为论文发表期刊的等级,grade(dr)表示对应论文期刊等级的常数影响值;da表示专利类型,patentType(da)为不同专利类型对应的常数影响值;db和de分别为项目经费和项目类别,fund(db)和projectType(de)分别为项目经费和项目类别对项目质量的影响值;步骤2.3:计算科技成果的人才贡献度科技成果的人才贡献度C,用正比例函数来表示其排名与贡献程度的关系:其中,m表示人才在该科技成果中的排名,即第几成员,1≤m≤4,排名靠后的成员;步骤2.4:计算科技成果的技术领域偏重度...
【专利技术属性】
技术研发人员:徐小良,顾高飞,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。