基于语义搜索的专家推荐方法、装置、设备及存储介质制造方法及图纸

技术编号:26031440 阅读:15 留言:0更新日期:2020-10-23 21:09
本申请提供一种基于语义搜索的专家推荐方法、装置、设备及存储介质,该专家推荐方法包括:获得用户输入的文本信息;对文本信息进行预处理,得到包括多个学术词语的学术词语集合;基于学术词语集合中的多个学术词语查询学术数据库,获得包括多个候选专家的候选专家列表;根据候选专家列表确定专家推荐结果。借助于上述技术方案,本申请能够自动、快速地为具体的专家合作需求给出匹配的学术专家,提高专家推荐结果的成功率。

【技术实现步骤摘要】
基于语义搜索的专家推荐方法、装置、设备及存储介质
本申请涉及计算机
,例如涉及一种基于语义搜索的专家推荐方法、装置、设备及存储介质。
技术介绍
目前,学术界与产业界、公共事务部门等领域的合作十分频繁,专家推荐是解决科研合作需求的重要步骤。现有的专家推荐系统中,输入通常是文本加上各种限制条件的组合。例如输入文本是“数据挖掘”,限制条件为北京地区,即需要专家推荐系统推荐出研究领域是数据挖掘,所在地区为北京的专家。然而,专家推荐系统通常是基于论文、专利等数据构建的,数据源中的语言描述偏学术化和专业化,由此也要求用户输入采用学术化的词语,当用户输入口语化、日常化等非学术化的表达需求时,推荐结果的相关性则较差。而且,现有的专家推荐系统通常以H-index等学术发表指标作为专家推荐结果的排序指标,对于以学术合作为需求的情况,得到的专家推荐结果排名和合作可能达成率之间缺乏关联,导致专家推荐结果的成功率较低。
技术实现思路
为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。该概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。本公开实施例提供了一种基于语义搜索的专家推荐方法、装置、设备及存储介质,以解决现有技术中存在着的专家推荐结果的成功率较低的问题。第一方面,本申请实施例提供了一种专家推荐方法,该专家推荐方法包括:获得用户输入的文本信息;对文本信息进行预处理,得到包括多个学术词语的学术词语集合;基于学术词语集合中的多个学术词语查询学术数据库,获得包括多个候选专家的候选专家列表;根据候选专家列表确定专家推荐结果。在一些实施例中,对文本信息进行预处理,得到包括多个学术词语的学术词语集合,包括:对文本信息进行分词并去除停用词,得到包括多个分词词语的分词词语集合;对分词词语集合中的分词词语进行语义化解析,转换获得包括多个学术词语的学术词语集合。在一些实施例中,对分词词语集合中的分词词语进行语义化解析,转换获得包括多个学术词语的学术词语集合,包括:将分词词语与预先构建的学术词语图谱进行匹配,其中,预先构建的学术词语图谱包括多个学术词语;根据所述分词词语与学术词语图谱中的学术词语的相似度选择学术词语作为分词词语的匹配结果;组合作为匹配结果的学术词语得到学术词语集合。在一些实施例中,基于学术词语集合中的多个学术词语查询学术数据库,获得包括多个候选专家的候选专家列表,包括:基于多个学术词语检索学术发表文档的信息及其引用量;聚合检索到的学术发表文档的作者信息形成候选专家列表。在一些实施例中,根据候选专家列表确定专家推荐结果,包括:根据候选专家列表和专家画像确定专家推荐结果,其中,专家画像包括学术与业界合作相关指标。在一些实施例中,学术与业界合作相关指标包括业界学术合作活跃度,业界学术合作活跃度是基于以下方式得到的:统计专家在历史时间段内的历史学术发表数据;根据历史学术发表数据中合作者为企业的组织信息生成专家业界合作记录;根据专家业界合作记录的数量计算业界学术合作活跃度。在一些实施例中,根据候选专家列表和专家画像确定专家推荐结果,包括:根据专家画像、专家的学术发表文档的信息及其引用量,确定多个候选专家的专家评分;按照每个候选专家的专家评分由高到低的顺序,对多个候选专家进行排序;根据排序后的专家列表生成专家推荐结果;其中,专家评分采用以下公式计算:;其中,score表示专家评分;表示专家的学术发表文档的总引用量;表示专家的第k篇学术发表文档的引用量;表示专家被检索出的第k篇学术发表文档的发表年份;n表示专家的学术发表文档的总数量;y表示当前年份;表示专家画像中包含的第j个指标;m表示专家画像中指标的总数量;表示对当前项进行数值归一化的函数。第二方面,本申请实施例提供了一种基于语义搜索的专家推荐装置,该专家推荐装置包括:获取模块,被配置为获得用户输入的文本信息;输入预处理模块,被配置为对文本信息进行预处理,得到包括多个学术词语的学术词语集合;专家检索模块,被配置为基于所述学术词语集合中的多个学术词语查询学术数据库,获得包括多个候选专家的候选专家列表;专家排序模块,被配置为根据所述候选专家列表确定专家推荐结果。第三方面,本申请实施例提供了一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行第一方面或第一方面的任一可选的实现方式所述的方法。第四方面,本申请实施例提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当所述电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行第一方面或第一方面的任一可选的实现方式所述的方法。第五方面,本申请提供一种计算机程序产品,所述计算机程序产品在计算机上运行时,使得计算机执行第一方面或第一方面的任意可能的实现方式中的方法。为使本申请实施例所要实现的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。本公开实施例提供的基于语义搜索的专家推荐方法、装置和产品,可以实现以下技术效果:本申请通过获得用户输入的文本信息,随后对文本信息进行预处理,得到包括多个学术词语的学术词语集合,随后基于学术词语集合中的多个学术词语查询学术数据库,获得包括多个候选专家的候选专家列表,随后根据候选专家列表确定专家推荐结果,从而可以获得符合需求的学术专家列表,以及能够自动、快速地为具体的专家合作需求给出匹配的学术专家,提高专家推荐结果的成功率。而且,本申请利用包括学术与业界合作相关指标的专家画像确定专家推荐结果,进一步提高了推荐专家与学术合作需求的匹配度,推荐效果更优。以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。附图说明至少一个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:图1示出了本申请实施例提供的一种基于语义搜索的专家推荐方法的流程图;图2示出了本申请实施例提供的一种基于语义搜索的专家推荐装置的结构框图;图3示出了本申请实施例提供的一种电子设备的结构框图。具体实施方式为了能够更加详尽地了解本公开实施例的特点与
技术实现思路
,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,至少一个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。专家推荐是解决科研合作需求的重要步骤。专家本文档来自技高网
...

【技术保护点】
1.一种基于语义搜索的专家推荐方法,其特征在于,包括:/n获得用户输入的文本信息;/n对所述文本信息进行预处理,得到包括多个学术词语的学术词语集合;/n基于所述学术词语集合中的多个学术词语查询学术数据库,获得包括多个候选专家的候选专家列表;/n根据所述候选专家列表确定专家推荐结果。/n

【技术特征摘要】
1.一种基于语义搜索的专家推荐方法,其特征在于,包括:
获得用户输入的文本信息;
对所述文本信息进行预处理,得到包括多个学术词语的学术词语集合;
基于所述学术词语集合中的多个学术词语查询学术数据库,获得包括多个候选专家的候选专家列表;
根据所述候选专家列表确定专家推荐结果。


2.根据权利要求1所述的方法,其特征在于,对所述文本信息进行预处理,得到包括多个学术词语的学术词语集合,包括:
对所述文本信息进行分词并去除停用词,得到包括多个分词词语的分词词语集合;
对所述分词词语集合中的分词词语进行语义化解析,转换获得包括多个学术词语的学术词语集合。


3.根据权利要求2所述的方法,其特征在于,对所述分词词语集合中的分词词语进行语义化解析,转换获得包括多个学术词语的学术词语集合,包括:
将所述分词词语与预先构建的学术词语图谱进行匹配,其中,所述预先构建的学术词语图谱包括多个学术词语;
根据所述分词词语与所述学术词语图谱中的学术词语的相似度选择学术词语作为所述分词词语的匹配结果;
组合作为匹配结果的学术词语得到所述学术词语集合。


4.根据权利要求3所述的方法,其特征在于,基于所述学术词语集合中的多个学术词语查询学术数据库,获得包括多个候选专家的候选专家列表,包括:
基于所述多个学术词语检索学术发表文档的信息及其引用量;
聚合检索到的学术发表文档的作者信息形成候选专家列表。


5.根据权利要求1至4中任一项所述的方法,其特征在于,根据所述候选专家列表确定专家推荐结果,包括:
根据所述候选专家列表和专家画像确定专家推荐结果,其中,所述专家画像包括学术与业界合作相关指标。


6.根据权利要求5所述的方法,其特征在于,所述学术与业界合作相关指标包括业界学术合作活跃度,所述业界学术合作活跃度是基于以下方式得...

【专利技术属性】
技术研发人员:王笑尘唐杰刘德兵张鹏仇瑜张伟
申请(专利权)人:北京智源人工智能研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1