【技术实现步骤摘要】
一种用于专家推荐的数据处理方法及装置
[0001]本专利技术涉及计算机信息处理
,更具体地说,涉及一种用于专家推荐的数据处理方法及装置
。
技术介绍
[0002]产学研合作是企业与高校或研究机构为实现自身需求或利益,以科技创新和研究成果转化为目标的一种合作方式,是促进科技成果转化的最有效途径之一
。
在产业转型升级过程中,产学研合作非常重要
。
企业研发新产品经常遭遇技术困难,希望与专家协作解决并希望通过某些途径寻找到相关领域的专家
。
[0003]目前,企业寻找专家的主要途径是通过相关人士推荐
。
这种以熟人社交为基础的推荐方式往往导致信息不完整,较难找到对口专家,会较大的影响产学研合作效果
。
判断一个专家是否能够匹配企业的技术人员需求,一般需要分析研究专家的特长
。
专家特长可以用其发表的论文或者专利等成果表征,原理上可以根据企业技术人员需求通过信息匹配方式推荐专家
。
[0004]近年来,随着自然语言处理技术的发展,关于文本方面的推荐方法在社交平台和电子商务领域得到广泛应用
。
推荐方法通常分为基于内容
、
基于协同过滤
、
基于规则等几种方法
。
基于内容的推荐通过挖掘商品的内容特征为用户推荐与自己偏好商品特征相类似的商品
。
与之类似,如果以成果文本表征专家特长,以需求文本表征技术难题,根据相似度计算结
【技术保护点】
【技术特征摘要】
1.
一种用于专家推荐的数据处理方法,其特征在于,包括:获取待匹配数据,所述待匹配数据包括待匹配企业需求数据和待匹配专家信息数据;构建科研词典,对待匹配企业需求数据进行数据处理,得到企业问题词项向量数据;构建专家语义模型,对待匹配专家信息数据进行聚类,得到相似专家聚类簇的中心词项向量数据;基于实践度算法,对企业问题词项向量数据和相似专家聚类簇的中心词项向量数据进行匹配处理,得到匹配结果数据
。2.
根据权利要1所述的一种用于专家推荐的数据处理方法,其特征在于,构建专家语义模型,对待匹配专家信息数据进行聚类,得到相似专家聚类簇的中心词项向量数据,包括:获取专家信息数据并提取出专家信息数据中的专家主题特征数据,通过专家主题特征数据构建专家知识表示模型;在专家知识表示模型中提取特征词数据,通过特征词数据建立词袋模型并构建专家
‑
词项矩阵,对专家
‑
词项矩阵处理得到语义专家
‑
词项矩阵,通过语义专家
‑
词项矩阵构建专家语义模型;对专家语义模型进行聚类,得到相似专家聚类簇的中心词项向量数据
。3.
根据权利要2所述的一种用于专家推荐的数据处理方法,其特征在于,通过专家主题特征数据构建专家知识表示模型的步骤包括:基于专家主题特征数据定义专家知识集数据,通过专家知识集数据表征专家物元知识模型;通过向量空间模型对专家物元知识模型扩展,得到专家知识表示模型
。4.
根据权利要3所述的一种用于专家推荐的数据处理方法,其特征在于,从专家知识表示模型中提取出所有专家的特征词数据,将特征词数据进行去重处理后,通过特征词数据建立词袋模型并构建专家词项向量数据,通过专家词项向量数据构建专家
‑
词项矩阵;将专家
‑
词项矩阵降维处理,对降维处理后的专家
‑
词项矩阵进行逆运算得到语义专家
‑
词项矩阵,通过语义专家
‑
词项矩阵构建专家语义模型
。5.
根据权利要4所述的一种用于专家推荐的数据处理方法,其特征在于,专家语义模型表示为:
SEM
=
(ID,Index,SW)
其中,
SEM
表示专家语义模型,
ID
表示专家的标识字段,
Index
表示专家位于语义专家
‑
词项矩阵中对应的位置,
SW
表示词项在语义专家
‑
词项矩阵中的权重集合
。6.
根据权利要5所述的一种用于专家推荐的数据处理方法,其特征在于,在专家语义模型中获得不同关键词数据中的潜在相关度数据,再对语义专家
‑
词项矩...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。