人物共现关系确定方法、专家推荐方法、装置及设备制造方法及图纸

技术编号:18458770 阅读:25 留言:0更新日期:2018-07-18 12:41
本申请实施例公开了一种人物共现关系确定方法、专家推荐方法、装置及设备,提高了人物共现关系确定准确率以及实现了为用户推荐专家的目的。其中,人物共现关系确定方法包括:获取第一人物的第一文本集合和第二人物的第二文本集合;从所述第一文本集合中抽取所述第一人物参与的事件,形成第一事件集合;从所述第二文本集合中抽取所述第二人物参与的事件,形成第二事件集合;从所述第一事件集合和所述第二事件集合中确定相同事件;基于所述相同事件构建所述第一人物和所述第二人物的共现关系。

Method for determining co occurrence relationship, expert recommendation method, device and equipment

The application example discloses a method of determining the co occurrence relationship of the characters, the method of expert recommendation, the device and the equipment, which improves the accuracy of the determination of the relationship between the characters and the purpose of recommending the experts to the users. Among them, the method of determining the co occurrence relationship of the personage includes: obtaining the first text set of the first character and the second text set of the second character; extracting the events of the first character from the first text set, forming the first event set, and extracting the events involving the second characters from the second text set. A set of second events is formed; the same event is determined from the set of first events and the second set of events described; based on the same event, the co occurrence of the first figure and the second character is constructed.

【技术实现步骤摘要】
人物共现关系确定方法、专家推荐方法、装置及设备
本申请涉及大数据领域,尤其涉及一种人物共现关系确定方法、专家推荐方法、装置及设备。
技术介绍
人物的共现关系是指两个或多个人物由于共同出现而建立的关系。人物的共现关系可以反映人物的社会合作或交往关系,是非常重要的信息。现有技术中人物共现关系根据两个或多个人物在文本中同时出现的频次来进行确定,但是同时出现的频次高并不一定能反映出人物之间是具有关系的,比如说,有多家新闻媒体在同一天报道了两个事件,这两个事件分别和一个人物相关,且这两个事件毫无关系,那么虽然这两个人物同时出现在这些新闻媒体在该天的新闻报道中,在文本中同时出现的频次较高,但是二者之间没有任何关系。可见,基于在文本中同时出现的频次来确定人物共现关系的方法准确性较低。
技术实现思路
为了解决现有技术中存在的技术问题,本申请提供了一种人物共现关系确定方法、专家推荐方法、装置及设备,实现提高人物共现关系确定准确性以及为用户推荐专家的目的。本申请实施例提供了一种人物共现关系确定方法,所述方法包括:获取第一人物的第一文本集合和第二人物的第二文本集合;从所述第一文本集合中抽取所述第一人物参与的事件,形成第一事件集合;从所述第二文本集合中抽取所述第二人物参与的事件,形成第二事件集合;从所述第一事件集合和所述第二事件集合中确定相同事件;基于所述相同事件构建所述第一人物和所述第二人物的共现关系。可选的,所述基于所述相同事件确定所述第一人物和所述第二人物的共现关系包括:从所述第一文本集合中确定包含所述相同事件的文本,形成第三文本集合;获取所述第三文本集合中各个文本的关键词,形成第一关键词集合;从所述第二文本集合中确定包含所述相同事件的文本,形成第四文本集合;获取所述第四文本集合中各个文本的关键词,形成第二关键词集合;若所述第一关键词集合和第二关键词集合之间的相似性大于预设阈值,则构建所述第一人物和所述第二人物之间的共现关系。可选的,所述第三文本集合和/或所述第四文本集合包括第一文本,根据如下方法得到所述第一文本的关键词:对所述第一文本进行分词,得到第一特征词;根据所述第一特征词在所述第一文本中出现的频次,以及其他特征词与所述第一特征词出现在同一个句子中的次数,得到所述第一特征词是否属于所述第一文本的关键词的判断结果。可选的,所述从所述第一事件集合和所述第二事件集合中确定相同事件包括:从所述第一事件集合和所述第二事件集合中确定事件内容相同,且事件发生时间和事件发生地点至少其中一个相同的事件。本申请实施例还提供了一种专家推荐方法,所述方法包括:获取待进行专家推荐的目标研究方向;基于所述目标研究方向以及预先获取的研究方向与专家的映射关系,得到待推荐专家;根据所述待推荐专家之间和/或与其他专家之间的共现关系,得到所述待推荐专家在所述目标研究方向上的影响力分值,其中,所述待推荐专家之间和/或与其他专家之间的共现关系根据权利要求1-5任意一项所述的人物共现关系确定方法进行确定;根据所述待推荐专家的影响力分值选取出目标专家进行推荐。可选的,所述获取待进行专家推荐的目标研究方向包括:获取检索语句,并对所述检索语句进行分词,得到分词结果;基于所述分词结果生成目标词向量,并从词向量库中选取出与所述目标词向量之间的距离满足预设条件的词向量,作为扩展词向量;将所述分词结果和与所述扩展词向量对应的词作为所述检索关键词;根据所述检索关键词在研究方向词库中确定所述目标研究方向。可选的,所述根据所述待推荐专家的影响力分值选取出目标专家进行推荐包括:根据所述待推荐专家的影响力分值以及预设影响力要素选取出目标专家进行推荐,所述预设影响力要素至少包括以下其中一项:所述待推荐专家在所述目标研究方向上发表的论文的数量、所述待推荐专家在所述目标研究方向上的新闻报道的数量、所述待推荐专家在所述目标研究方向上发表的文章的阅读量、所述待推荐专家在所述目标研究方向上参与的学术活动的次数、所述待推荐专家在所述目标研究方向上发行的著作数量以及发行量。本申请实施例还提供了一种专家推荐方法,所述方法包括:获取第一专家;从专家共现关系库中获取与所述第一专家具有共现关系的第二专家,所述专家共现关系库根据所述的人物共现关系确定方法进行构建;基于所述第一专家推荐所述第二专家。可选的,所述基于所述第一专家推荐所述第二专家包括:获取所述第一专家和所述第二专家共现在相同事件的事件个数;若所述事件个数满足第一预设条件,则基于所述第一专家推荐所述第二专家。可选的,所述方法还包括:根据研究方向与专家的映射关系,得到所述第一专家的第一研究方向集合,所述第一专家的研究方向集合包括所述第一专家的至少一个研究方向;根据所述研究方向与专家的映射关系,确定与所述第一专家在至少一个研究方向上相同的专家,和/或,确定与所述第一专家具有共现关系的专家,作为第三专家;根据所述研究方向与专家的映射关系,得到所述第三专家的第三研究方向集合,所述第三研究方向集合包括所述第三专家的至少一个研究方向;获取所述第一专家的文本,并计算所述第一研究方向集合中的各个研究方向分别在所述第一专家的文本中出现的频次,并根据所述频次对所述第一专家的各个研究方向进行排序,得到第一研究方向向量;获取所述第三专家的文本,并计算所述第三研究方向集合中的各个研究方向分别在所述第三专家的文本中出现的频次,并根据所述频次对所述第三专家的各个研究方向进行排序,得到第二研究方向向量;根据所述第一研究方向向量和所述第二研究方向向量之间的距离,得到所述第三专家与所述第一专家的第一相似度;若所述第一相似度满足第二预设条件,则基于所述第一专家推荐所述第三专家。可选的,所述方法还包括:根据领域与专家的映射关系,得到所述第一专家的第一领域集合,所述第一领域集合包括所述第一专家的至少一个所在领域;根据所述领域与专家的映射关系,获取与所述第一专家的第一领域集合中至少一个所在领域相同的第四专家;根据所述领域与专家的映射关系,获取所述第四专家的第四领域集合,所述第四领域集合包括所述第四专家的至少一个所在领域;根据所述第一领域集合和所述第四领域集合之间的相似度,得到所述第四专家与所述第一专家的第二相似度;若所述第二相似度满足第三预设条件,则基于所述第一专家推荐所述第四专家。本申请实施例还提供了一种人物共现关系确定装置,所述装置包括:获取单元,用于获取第一人物的第一文本集合和第二人物的第二文本集合;第一抽取单元,用于从所述第一文本集合中抽取所述第一人物参与的事件,形成第一事件集合;第二抽取单元,用于从所述第二文本集合中抽取所述第二人物参与的事件,形成第二事件集合;事件确定单元,用于从所述第一事件集合和所述第二事件集合中确定相同事件;构建单元,用于基于所述相同事件构建所述第一人物和所述第二人物的共现关系。可选的,所述构建单元,包括:第一文本确定单元,用于从所述第一文本集合中确定包含所述相同事件的文本,形成第三文本集合;第一关键词获取单元,用于获取所述第三文本集合中各个文本的关键词,形成第一关键词集合;第二文本确定单元,用于从所述第二文本集合中确定包含所述相同事件的文本,形成第四文本集合;第二关键词获取单元,用于获取所述第四文本集合中各个文本的关键词,形成第二关键词集合;构建本文档来自技高网...

【技术保护点】
1.一种人物共现关系确定方法,其特征在于,所述方法包括:获取第一人物的第一文本集合和第二人物的第二文本集合;从所述第一文本集合中抽取所述第一人物参与的事件,形成第一事件集合;从所述第二文本集合中抽取所述第二人物参与的事件,形成第二事件集合;从所述第一事件集合和所述第二事件集合中确定相同事件;基于所述相同事件构建所述第一人物和所述第二人物的共现关系。

【技术特征摘要】
1.一种人物共现关系确定方法,其特征在于,所述方法包括:获取第一人物的第一文本集合和第二人物的第二文本集合;从所述第一文本集合中抽取所述第一人物参与的事件,形成第一事件集合;从所述第二文本集合中抽取所述第二人物参与的事件,形成第二事件集合;从所述第一事件集合和所述第二事件集合中确定相同事件;基于所述相同事件构建所述第一人物和所述第二人物的共现关系。2.根据权利要求1所述的方法,其特征在于,所述基于所述相同事件确定所述第一人物和所述第二人物的共现关系包括:从所述第一文本集合中确定包含所述相同事件的文本,形成第三文本集合;获取所述第三文本集合中各个文本的关键词,形成第一关键词集合;从所述第二文本集合中确定包含所述相同事件的文本,形成第四文本集合;获取所述第四文本集合中各个文本的关键词,形成第二关键词集合;若所述第一关键词集合和第二关键词集合之间的相似性大于预设阈值,则构建所述第一人物和所述第二人物之间的共现关系。3.根据权利要求2所述的方法,其特征在于,所述第三文本集合和/或所述第四文本集合包括第一文本,根据如下方法得到所述第一文本的关键词:对所述第一文本进行分词,得到第一特征词;根据所述第一特征词在所述第一文本中出现的频次,以及其他特征词与所述第一特征词出现在同一个句子中的次数,得到所述第一特征词是否属于所述第一文本的关键词的判断结果。4.根据权利要求1所述的方法,其特征在于,所述从所述第一事件集合和所述第二事件集合中确定相同事件包括:从所述第一事件集合和所述第二事件集合中确定事件内容相同,且事件发生时间和事件发生地点至少其中一个相同的事件。5.一种专家推荐方法,其特征在于,所述方法包括:获取待进行专家推荐的目标研究方向;基于所述目标研究方向以及预先获取的研究方向与专家的映射关系,得到待推荐专家;根据所述待推荐专家之间和/或与其他专家之间的共现关系,得到所述待推荐专家在所述目标研究方向上的影响力分值,其中,所述待推荐专家之间和/或与其他专家之间的共现关系根据权利要求1-5任意一项所述的人物共现关系确定方法进行确定;根据所述待推荐专家的影响力分值选取出目标专家进行推荐。6.根据权利要求5所述的方法,其特征在于,所述获取待进行专家推荐的目标研究方向包括:获取检索语句,并对所述检索语句进行分词,得到分词结果;基于所述分词结果生成目标词向量,并从词向量库中选取出与所述目标词向量之间的距离满足预设条件的词向量,作为扩展词向...

【专利技术属性】
技术研发人员:蔡巍崔朝辉赵立军张霞
申请(专利权)人:东软集团股份有限公司
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1