一种用于专家推荐的数据处理方法及装置制造方法及图纸

技术编号:39583092 阅读:7 留言:0更新日期:2023-12-03 19:32
本发明专利技术公开了一种用于专家推荐的数据处理方法及装置,属于计算机信息处理技术领域

【技术实现步骤摘要】
一种用于专家推荐的数据处理方法及装置


[0001]本专利技术涉及计算机信息处理
,更具体地说,涉及一种用于专家推荐的数据处理方法及装置


技术介绍

[0002]产学研合作是企业与高校或研究机构为实现自身需求或利益,以科技创新和研究成果转化为目标的一种合作方式,是促进科技成果转化的最有效途径之一

在产业转型升级过程中,产学研合作非常重要

企业研发新产品经常遭遇技术困难,希望与专家协作解决并希望通过某些途径寻找到相关领域的专家

[0003]目前,企业寻找专家的主要途径是通过相关人士推荐

这种以熟人社交为基础的推荐方式往往导致信息不完整,较难找到对口专家,会较大的影响产学研合作效果

判断一个专家是否能够匹配企业的技术人员需求,一般需要分析研究专家的特长

专家特长可以用其发表的论文或者专利等成果表征,原理上可以根据企业技术人员需求通过信息匹配方式推荐专家

[0004]近年来,随着自然语言处理技术的发展,关于文本方面的推荐方法在社交平台和电子商务领域得到广泛应用

推荐方法通常分为基于内容

基于协同过滤

基于规则等几种方法

基于内容的推荐通过挖掘商品的内容特征为用户推荐与自己偏好商品特征相类似的商品

与之类似,如果以成果文本表征专家特长,以需求文本表征技术难题,根据相似度计算结果,可以提出一种基于内容的专家推荐方法,为企业推荐相关领域的专家,达成企业和高校的互利共赢

[0005]经检索,中国专利申请,申请号
201911175078.6
,公开日
2020
年5月
15
日,公开了一种专家推荐方法及系统

该方法包括:根据基础关键词,获取关键词序列;将关键词序列输入到若干现有专家推荐系统中,获取推荐结果集合;对于任一推荐结果序列中的任一专家,根据任一现有专家推荐系统的类型

任一专家在任一推荐结构序列中的推荐程度,获取任一专家的推荐评分;根据每一专家的推荐评分,获取专家推荐结果

该方法可以在不依赖于本地数据库的前提下,在多个现有的专家推荐系统的基础上,给用户呈现更加全面

标准更加统一的推荐结果序列

但是该方法并未考虑到现有平台的算法具有一定缺陷,并不能做到精确地推荐专家,也无法满足企业与高校或研究机构之间的产学研合作


技术实现思路

[0006]1.
要解决的技术问题
[0007]针对现有技术中存在的企业人才需求得不到及时解决

高校专家资源无法得到有效利用进而导致不能很好地实现企业与高校或研究机构产学研合作的问题,本专利技术提供了一种用于专家推荐的数据处理方法及装置,基于实践度算法对企业问题词项向量数据和相似专家聚类簇的中心词项向量数据进行匹配处理,得到匹配结果数据,从而可以较好地缓解人工方式进行专家推荐存在的效率低下

准确性不足等问题,进而有效推进企业与高校
或研究机构产学研合作

[0008]2.
技术方案
[0009]本专利技术的目的通过以下技术方案实现

[0010]一种用于专家推荐的数据处理方法,包括:
[0011]获取待匹配数据,所述待匹配数据包括待匹配企业需求数据和待匹配专家信息数据;
[0012]构建科研词典,对待匹配企业需求数据进行数据处理,得到企业问题词项向量数据;
[0013]构建专家语义模型,对待匹配专家信息数据进行聚类,得到相似专家聚类簇的中心词项向量数据;
[0014]基于实践度算法,对企业问题词项向量数据和相似专家聚类簇的中心词项向量数据进行匹配处理,得到匹配结果数据

[0015]进一步地,构建专家语义模型,对待匹配专家信息数据进行聚类,得到相似专家聚类簇的中心词项向量数据,包括:
[0016]获取专家信息数据并提取出专家信息数据中的专家主题特征数据,通过专家主题特征数据构建专家知识表示模型;
[0017]在专家知识表示模型中提取特征词数据,通过特征词数据建立词袋模型并构建专家

词项矩阵,对专家

词项矩阵处理得到语义专家

词项矩阵,通过语义专家

词项矩阵构建专家语义模型;
[0018]对专家语义模型进行聚类,得到相似专家聚类簇的中心词项向量数据

[0019]进一步地,通过专家主题特征数据构建专家知识表示模型的步骤包括:
[0020]基于专家主题特征数据定义专家知识集数据,通过专家知识集数据表征专家物元知识模型;
[0021]通过向量空间模型对专家物元知识模型扩展,得到专家知识表示模型

[0022]进一步地,从专家知识表示模型中提取出所有专家的特征词数据,将特征词数据进行去重处理后,通过特征词数据建立词袋模型并构建专家词项向量数据,通过专家词项向量数据构建专家

词项矩阵;
[0023]将专家

词项矩阵降维处理,对降维处理后的专家

词项矩阵进行逆运算得到语义专家

词项矩阵,通过语义专家

词项矩阵构建专家语义模型

[0024]进一步地,专家语义模型表示为:
[0025]SEM

(ID,Index,SW)
[0026]其中,
SEM
表示专家语义模型,
ID
表示专家的标识字段,
Index
表示专家位于语义专家

词项矩阵中对应的位置,
SW
表示词项在语义专家

词项矩阵中的权重集合

[0027]进一步地,在专家语义模型中获得不同关键词数据中的潜在相关度数据,再对语义专家

词项矩阵进行降维和逆运算处理获取语义专家

词项矩阵中的潜在语义信息数据,得到专家之间相似度矩阵数据;
[0028]通过
K

MEANS
算法对专家之间相似度矩阵数据进行聚类,得到相似专家聚类簇的中心词项向量数据

[0029]进一步地,构建科研词典,对待匹配企业需求数据进行数据处理,得到企业问题词
项向量数据,包括:
[0030]获取并解析科研数据得到关键词数据,对关键词数据处理构建科研词典;
[0031]根据已构建的科研词典,以最长匹配原则对待匹配企业需求数据进行数据处理,并依据词袋模型得到企业问题词项向量数据...

【技术保护点】

【技术特征摘要】
1.
一种用于专家推荐的数据处理方法,其特征在于,包括:获取待匹配数据,所述待匹配数据包括待匹配企业需求数据和待匹配专家信息数据;构建科研词典,对待匹配企业需求数据进行数据处理,得到企业问题词项向量数据;构建专家语义模型,对待匹配专家信息数据进行聚类,得到相似专家聚类簇的中心词项向量数据;基于实践度算法,对企业问题词项向量数据和相似专家聚类簇的中心词项向量数据进行匹配处理,得到匹配结果数据
。2.
根据权利要1所述的一种用于专家推荐的数据处理方法,其特征在于,构建专家语义模型,对待匹配专家信息数据进行聚类,得到相似专家聚类簇的中心词项向量数据,包括:获取专家信息数据并提取出专家信息数据中的专家主题特征数据,通过专家主题特征数据构建专家知识表示模型;在专家知识表示模型中提取特征词数据,通过特征词数据建立词袋模型并构建专家

词项矩阵,对专家

词项矩阵处理得到语义专家

词项矩阵,通过语义专家

词项矩阵构建专家语义模型;对专家语义模型进行聚类,得到相似专家聚类簇的中心词项向量数据
。3.
根据权利要2所述的一种用于专家推荐的数据处理方法,其特征在于,通过专家主题特征数据构建专家知识表示模型的步骤包括:基于专家主题特征数据定义专家知识集数据,通过专家知识集数据表征专家物元知识模型;通过向量空间模型对专家物元知识模型扩展,得到专家知识表示模型
。4.
根据权利要3所述的一种用于专家推荐的数据处理方法,其特征在于,从专家知识表示模型中提取出所有专家的特征词数据,将特征词数据进行去重处理后,通过特征词数据建立词袋模型并构建专家词项向量数据,通过专家词项向量数据构建专家

词项矩阵;将专家

词项矩阵降维处理,对降维处理后的专家

词项矩阵进行逆运算得到语义专家

词项矩阵,通过语义专家

词项矩阵构建专家语义模型
。5.
根据权利要4所述的一种用于专家推荐的数据处理方法,其特征在于,专家语义模型表示为:
SEM

(ID,Index,SW)
其中,
SEM
表示专家语义模型,
ID
表示专家的标识字段,
Index
表示专家位于语义专家

词项矩阵中对应的位置,
SW
表示词项在语义专家

词项矩阵中的权重集合
。6.
根据权利要5所述的一种用于专家推荐的数据处理方法,其特征在于,在专家语义模型中获得不同关键词数据中的潜在相关度数据,再对语义专家

词项矩...

【专利技术属性】
技术研发人员:杨学志封军尚楚涵
申请(专利权)人:合肥工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1