The application example discloses a method of determining the co occurrence relationship of the characters, the method of expert recommendation, the device and the equipment, which improves the accuracy of the determination of the relationship between the characters and the purpose of recommending the experts to the users. Among them, the method of determining the co occurrence relationship of the personage includes: obtaining the first text set of the first character and the second text set of the second character; extracting the events of the first character from the first text set, forming the first event set, and extracting the events involving the second characters from the second text set. A set of second events is formed; the same event is determined from the set of first events and the second set of events described; based on the same event, the co occurrence of the first figure and the second character is constructed.
【技术实现步骤摘要】
人物共现关系确定方法、专家推荐方法、装置及设备
本申请涉及大数据领域,尤其涉及一种人物共现关系确定方法、专家推荐方法、装置及设备。
技术介绍
人物的共现关系是指两个或多个人物由于共同出现而建立的关系。人物的共现关系可以反映人物的社会合作或交往关系,是非常重要的信息。现有技术中人物共现关系根据两个或多个人物在文本中同时出现的频次来进行确定,但是同时出现的频次高并不一定能反映出人物之间是具有关系的,比如说,有多家新闻媒体在同一天报道了两个事件,这两个事件分别和一个人物相关,且这两个事件毫无关系,那么虽然这两个人物同时出现在这些新闻媒体在该天的新闻报道中,在文本中同时出现的频次较高,但是二者之间没有任何关系。可见,基于在文本中同时出现的频次来确定人物共现关系的方法准确性较低。
技术实现思路
为了解决现有技术中存在的技术问题,本申请提供了一种人物共现关系确定方法、专家推荐方法、装置及设备,实现提高人物共现关系确定准确性以及为用户推荐专家的目的。本申请实施例提供了一种人物共现关系确定方法,所述方法包括:获取第一人物的第一文本集合和第二人物的第二文本集合;从所述第一文本集合中抽取所述第一人物参与的事件,形成第一事件集合;从所述第二文本集合中抽取所述第二人物参与的事件,形成第二事件集合;从所述第一事件集合和所述第二事件集合中确定相同事件;基于所述相同事件构建所述第一人物和所述第二人物的共现关系。可选的,所述基于所述相同事件确定所述第一人物和所述第二人物的共现关系包括:从所述第一文本集合中确定包含所述相同事件的文本,形成第三文本集合;获取所述第三文本集合中各个文本的关键词,形 ...
【技术保护点】
1.一种人物共现关系确定方法,其特征在于,所述方法包括:获取第一人物的第一文本集合和第二人物的第二文本集合;从所述第一文本集合中抽取所述第一人物参与的事件,形成第一事件集合;从所述第二文本集合中抽取所述第二人物参与的事件,形成第二事件集合;从所述第一事件集合和所述第二事件集合中确定相同事件;基于所述相同事件构建所述第一人物和所述第二人物的共现关系。
【技术特征摘要】
1.一种人物共现关系确定方法,其特征在于,所述方法包括:获取第一人物的第一文本集合和第二人物的第二文本集合;从所述第一文本集合中抽取所述第一人物参与的事件,形成第一事件集合;从所述第二文本集合中抽取所述第二人物参与的事件,形成第二事件集合;从所述第一事件集合和所述第二事件集合中确定相同事件;基于所述相同事件构建所述第一人物和所述第二人物的共现关系。2.根据权利要求1所述的方法,其特征在于,所述基于所述相同事件确定所述第一人物和所述第二人物的共现关系包括:从所述第一文本集合中确定包含所述相同事件的文本,形成第三文本集合;获取所述第三文本集合中各个文本的关键词,形成第一关键词集合;从所述第二文本集合中确定包含所述相同事件的文本,形成第四文本集合;获取所述第四文本集合中各个文本的关键词,形成第二关键词集合;若所述第一关键词集合和第二关键词集合之间的相似性大于预设阈值,则构建所述第一人物和所述第二人物之间的共现关系。3.根据权利要求2所述的方法,其特征在于,所述第三文本集合和/或所述第四文本集合包括第一文本,根据如下方法得到所述第一文本的关键词:对所述第一文本进行分词,得到第一特征词;根据所述第一特征词在所述第一文本中出现的频次,以及其他特征词与所述第一特征词出现在同一个句子中的次数,得到所述第一特征词是否属于所述第一文本的关键词的判断结果。4.根据权利要求1所述的方法,其特征在于,所述从所述第一事件集合和所述第二事件集合中确定相同事件包括:从所述第一事件集合和所述第二事件集合中确定事件内容相同,且事件发生时间和事件发生地点至少其中一个相同的事件。5.一种专家推荐方法,其特征在于,所述方法包括:获取待进行专家推荐的目标研究方向;基于所述目标研究方向以及预先获取的研究方向与专家的映射关系,得到待推荐专家;根据所述待推荐专家之间和/或与其他专家之间的共现关系,得到所述待推荐专家在所述目标研究方向上的影响力分值,其中,所述待推荐专家之间和/或与其他专家之间的共现关系根据权利要求1-5任意一项所述的人物共现关系确定方法进行确定;根据所述待推荐专家的影响力分值选取出目标专家进行推荐。6.根据权利要求5所述的方法,其特征在于,所述获取待进行专家推荐的目标研究方向包括:获取检索语句,并对所述检索语句进行分词,得到分词结果;基于所述分词结果生成目标词向量,并从词向量库中选取出与所述目标词向量之间的距离满足预设条件的词向量,作为扩展词向...
【专利技术属性】
技术研发人员:蔡巍,崔朝辉,赵立军,张霞,
申请(专利权)人:东软集团股份有限公司,
类型:发明
国别省市:辽宁,21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。