基于人工智能的专家推荐方法、装置、终端、及介质制造方法及图纸

技术编号:23099229 阅读:13 留言:0更新日期:2020-01-14 20:37
本申请提供基于人工智能的专家推荐方法、装置、终端、及介质,本发明专利技术提供了一种利用数据挖掘、自然语言处理技术精准推荐科研学者的推荐系统。其中包含两种更方面更为合理的评价方法:第一方面,充分考虑文献影响力时间衰减效应和引用提升效应两者结合,跳出以往的只看静态影响因子的文献影响力评价方法;第二方面,充分利用先进的自然语言处理技术,从文献摘要、标题、全文等内容进行分词处理,再结合关键词,统计研究领域词汇出现频次,该方法使词频统计范围更加全面。最终该科研学者推荐系统能根据检索者的搜索词精准推荐专家名单,并给出专家专注度排序。

Expert recommendation methods, devices, terminals and media based on Artificial Intelligence

【技术实现步骤摘要】
基于人工智能的专家推荐方法、装置、终端、及介质
本申请涉及人工智能
,特别是涉及基于人工智能的专家推荐方法、装置、终端、及介质。
技术介绍
近几年来,随着人工智能和大数据的发展,通过多维度数据的融合为人物建立数据画像,尤其是在互联网平台上为用户建立用户画像,已成为把握一个人群特征的重要手段;另一方面,构建专家数据库、建立专家画像则是建立高层次人才库、引导产学研合作和科研机构研究成果转化的重要特征。为更好地获得成果转化供需方匹配、专家推荐的效果,前述构建专家数据库、专家画像除了应当包括专家的研究方向、论文信息、合作对象等专家的基本信息外,还应当包括专家的社会兼职、获得奖项、荣誉称号等能代表专家在学术界地位的附加信息。但是,由于前述附加信息具有非结构化、表述多样化的数据特点,须通过技术手段将其转换为标准化、结构化的数据之后才能录入专家数据库。随着数据挖掘算法效果的提升,从海量信息中挖掘人物的特征要素的技术也日趋完善,这些技术与专家信息的融合将有助于解决专家数据库维度不够、专家画像不全面等问题。但是,这些技术仍不能实现精准地有针对性地推荐专家。申请内容鉴于以上所述现有技术的缺点,本申请的目的在于提供基于人工智能的专家推荐方法、装置、终端、及介质,用于解决现有技术中的不能精准地有针对性地推荐专家的问题。为实现上述目的及其他相关目的,本申请的第一方面提供一种基于人工智能的专家推荐方法,其包括:利用网页排名算法计算关联于专家的每篇文本作品的影响力数据;利用分词算法对所述关联于专家的每篇文本作品进行分词处理,并计算分词结果信息在基于文章关键词所构建的研究领域词库中出现的频次数据;根据所述每篇文本作品的影响力数据以及每篇文本作品的分词结果信息在所述研究领域词库中出现的频次数据,计算各专家的关注度数据;其中,各专家的关注度数据的计算结果用于进行专家推荐。于本申请的第一方面的一些实施例中,所述利用网页排名算法计算关联于专家的每篇文本作品的影响力数据,其包括:利用网页排名算法计算所述文本作品的网页排名数据;根据所述文本作品的发表时间数据对其网页排名数据做加权计算后生成所述影响力数据。于本申请的第一方面的一些实施例中,所述利用网页排名算法计算所述文本作品的网页排名数据,其包括:获取所述文本作品的至少包括引文关系信息的作品基本信息,以根据所述文本作品的引文关系构建对应的引文网络;根据所述文本作品所在期刊的影响因子为所述文本作品设置初始网页排名数据;基于所述文本作品的初始网页排名数据并通过多轮引用计算,获取所述文本作品最终网页排名数据。于本申请的第一方面的一些实施例中,所述根据所述文本作品的发表时间数据对其网页排名数据做加权计算后生成所述影响力数据,其包括:所述文本作品发表的时间越早,则文本作品的影响力越小。于本申请的第一方面的一些实施例中,所述文本作品的基本信息还包括如下信息中的任意一种或多种的组合:文本作品的标题信息、关键词信息、发表时间信息、作者姓名信息、及发表期刊信息。于本申请的第一方面的一些实施例中,所述专家与文本作品之间的关联关系包括:以所述文本作品的作者为所述专家。于本申请的第一方面的一些实施例中,所述各专家的关注度数据的计算结果用于进行专家推荐,其包括:根据各专家的关注度数据的计算结果由高到低进行专家推荐;其中,各专家的关注度数据的计算结果包括关联于所述专家的所有文学作品的关注度数据的总和值或平均值。为实现上述目的及其他相关目的,本申请的第二方面提供一种基于人工智能的专家推荐装置,其包括:影响力数据计算模块,用于利用网页排名算法计算关联于专家的每篇文本作品的影响力数据;频次数据计算模块,用于利用分词算法对所述关联于专家的每篇文本作品进行分词处理,并计算分词结果信息在基于文章关键词所构建的研究领域词库中出现的频次数据;专家推荐模块,用于根据所述每篇文本作品的影响力数据以及每篇文本作品的分词结果信息在所述研究领域词库中出现的频次数据,计算各专家的关注度数据;其中,各专家的关注度数据的计算结果用于进行专家推荐。为实现上述目的及其他相关目的,本申请的第三方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于人工智能的专家推荐方法。为实现上述目的及其他相关目的,本申请的第四方面提供一种电子终端,包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行所述基于人工智能的专家推荐方法。如上所述,本申请的基于人工智能的专家推荐方法、装置、终端、及介质,具有以下有益效果:本专利技术提供了一种利用数据挖掘、自然语言处理技术精准推荐科研学者的推荐系统。其中包含两种更方面更为合理的评价方法:第一方面,充分考虑文献影响力时间衰减效应和引用提升效应两者结合,跳出以往的只看静态影响因子的文献影响力评价方法;第二方面,充分利用先进的自然语言处理技术,从文献摘要、标题、全文等内容进行分词处理,再结合关键词,统计研究领域词汇出现频次,该方法使词频统计范围更加全面。最终该科研学者推荐系统能根据检索者的搜索词精准推荐专家名单,并给出专家专注度排序。附图说明图1显示为本申请一实施例中基于人工智能的专家推荐方法的流程示意图。图2显示为上文实施例中步骤S1的各个分步骤的流程示意图。图3显示为上文实施例中步骤S11的各个分步骤的流程示意图。图4显示为上文实施例中的基于人工智能的专家推荐装置的结构示意图。图5显示为申请实施例提供的再一种电子终端的结构示意图。具体实施方式以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。需要说明的是,在下述描述中,参考附图,附图描述了本申请的若干实施例。应当理解,还可使用其他实施例,并且可以在不背离本申请的精神和范围的情况下进行机械组成、结构、电气以及操作上的改变。下面的详细描述不应该被认为是限制性的,并且本申请的实施例的范围仅由公布的专利的权利要求书所限定。这里使用的术语仅是为了描述特定实施例,而并非旨在限制本申请。空间相关的术语,例如“上”、“下”、“左”、“右”、“下面”、“下方”、“下部”、“上方”、“上部”等,可在文中使用以便于说明图中所示的一个元件或特征与另一元件或特征的关系。在本申请中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”、“固持”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据本文档来自技高网...

【技术保护点】
1.一种基于人工智能的专家推荐方法,其特征在于,包括:/n利用网页排名算法计算关联于专家的每篇文本作品的影响力数据;/n利用分词算法对所述关联于专家的每篇文本作品进行分词处理,并计算分词结果信息在基于文章关键词所构建的研究领域词库中出现的频次数据;/n根据所述每篇文本作品的影响力数据以及每篇文本作品的分词结果信息在所述研究领域词库中出现的频次数据,计算各专家的关注度数据;其中,各专家的关注度数据的计算结果用于进行专家推荐。/n

【技术特征摘要】
1.一种基于人工智能的专家推荐方法,其特征在于,包括:
利用网页排名算法计算关联于专家的每篇文本作品的影响力数据;
利用分词算法对所述关联于专家的每篇文本作品进行分词处理,并计算分词结果信息在基于文章关键词所构建的研究领域词库中出现的频次数据;
根据所述每篇文本作品的影响力数据以及每篇文本作品的分词结果信息在所述研究领域词库中出现的频次数据,计算各专家的关注度数据;其中,各专家的关注度数据的计算结果用于进行专家推荐。


2.根据权利要求1所述的方法,其特征在于,所述利用网页排名算法计算关联于专家的每篇文本作品的影响力数据,其包括:
利用网页排名算法计算所述文本作品的网页排名数据;
根据所述文本作品的发表时间数据对其网页排名数据做加权计算后生成所述影响力数据。


3.根据权利要求2所述的方法,其特征在于,所述利用网页排名算法计算所述文本作品的网页排名数据,其包括:
获取所述文本作品的至少包括引文关系信息的作品基本信息,以根据所述文本作品的引文关系构建对应的引文网络;
根据所述文本作品所在期刊的影响因子为所述文本作品设置初始网页排名数据;
基于所述文本作品的初始网页排名数据并通过多轮引用计算,获取所述文本作品最终网页排名数据。


4.根据权利要求2所述的方法,其特征在于,所述根据所述文本作品的发表时间数据对其网页排名数据做加权计算后生成所述影响力数据,其包括:所述文本作品发表的时间越早,则文本作品的影响力越小。


5.根据权利要求2所述的方法,其特征在于,所述文本作品的基本信息还包括如下信息中的任意一种...

【专利技术属性】
技术研发人员:朱悦田欣普丽娜翁泉飞张嘉锐
申请(专利权)人:上海科技发展有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1