一种信息推荐方法和装置制造方法及图纸

技术编号:18553616 阅读:31 留言:0更新日期:2018-07-28 10:45
本发明专利技术实施例公开了一种信息推荐方法和装置;本发明专利技术实施例在接收到原始文本信息后,可以从原始文本信息中提取种子,然后,分别通过预设知识图谱和该种子的实体上位词来选择候选实体集合,并基于该候选实体集合确定推荐信息,以进行推荐;该方案可以大大增强结果的可控性,不仅可以提高候选实体的可用性,而且可以提高召回率,大大改善了推荐效果。

【技术实现步骤摘要】
一种信息推荐方法和装置
本专利技术涉及通信
,具体涉及一种信息推荐方法和装置。
技术介绍
随着互联网技术的发展,以及终端的普及,网络信息推荐已经成为人们获取和分享资讯的一个重要途径。在网络信息推荐技术中,相关信息,比如同义词、近义词、下位词、和/或上位词等信息的获取对推荐结果的精准性和全面性具有较大影响。在现有技术中,一般都会采用开放式实体(Entity)抽取技术来统计各类信息同现的概率,并采用互信息(MutualInformation)等指标,来确定各类信息之间的相关度,进而根据相关度来获取当前所需信息的相关信息,以进行推荐,从而达到提高推荐结果精准性和全面性的目的。其中,开放式实体抽取技术是文本信息抽取(TextInformationExtraction)技术的一种,其主要目标是根据用户输入的特定语义类的若干实体(也称为“种子”或“种子词”)从网络中抽取同类型的实体,以及在开放性文本中找出该语义类包含的其他实体,例如,给出“中国、美国、俄罗斯”这三个种子,要求找出“国家”这个语义类的其他实体,诸如“德国、法国、日本…”等。在对现有技术的研究和实践过程中,本专利技术的专利技术本文档来自技高网...

【技术保护点】
1.一种信息推荐方法,其特征在于,包括:接收原始文本信息,从所述原始文本信息中提取种子;根据预设知识图谱获取与所述种子具有预设关系的实体,得到第一关系实体集合;获取与所述种子具有相同实体上位词的其他实体,得到第二关系实体集合;将所述第一关系实体集合和第二关系实体集合的并集确定为候选实体集合;基于所述候选实体集合确定推荐信息,并推荐所述推荐信息。

【技术特征摘要】
1.一种信息推荐方法,其特征在于,包括:接收原始文本信息,从所述原始文本信息中提取种子;根据预设知识图谱获取与所述种子具有预设关系的实体,得到第一关系实体集合;获取与所述种子具有相同实体上位词的其他实体,得到第二关系实体集合;将所述第一关系实体集合和第二关系实体集合的并集确定为候选实体集合;基于所述候选实体集合确定推荐信息,并推荐所述推荐信息。2.根据权利要求1所述的方法,其特征在于,所述根据预设知识图谱获取与所述种子具有预设关系的实体,得到第一关系实体集合,包括:将所述种子映射到预设知识库中的实体上,所述知识库根据预设知识图谱建立而成;获取所述种子在所述知识库中与其他实体的关系边数量,得到所述种子与其他实体在所述知识库中的关系度;从所述预设知识库中提取关系度满足预设阈值的实体,得到第一关系实体集合。3.根据权利要求1所述的方法,其特征在于,所述获取与所述种子具有相同实体上位词的其他实体,得到第二关系实体集合,包括:获取所述种子的实体上位词;获取所述实体上位词的实体下位词;从所述实体下位词中提取出所述种子之外的其他实体,得到第二关系实体集合。4.根据权利要求1至3任一项所述的方法,其特征在于,所述基于所述候选实体集合确定推荐信息,包括:分别统计所述候选实体集合中各候选实体与所述种子的相关程度,以得到各候选实体的推荐分数;将推荐分数大于设定值的候选实体确定为推荐信息。5.根据权利要求4所述的方法,其特征在于,所述分别统计所述候选实体集合中各候选实体与所述种子的相关程度,以得到各候选实体的推荐分数,包括:分别统计所述候选实体集合中各候选实体与所述种子在开放文本中的相关程度,得到各候选实体的同现分数;分别统计所述候选实体集合中各候选实体与所述种子在知识图谱中的关系权重,得到各候选实体的关系分数;分别统计所述候选实体集合中各候选实体的实体上位词与所述种子的实体上位词的相关程度,得到各候选实体的相关分数;根据所述同现分数、关系分数和相关分数分别计算各候选实体的推荐分数。6.根据权利要求5所述的方法,其特征在于,所述分别统计所述候选实体集合中各候选实体与所述种子在开放文本中的相关程度,得到各候选实体的同现分数,包括:获取预设时间范围内的开放文本;分别计算所述候选实体集合中各候选实体与所述种子在获取到的开放文本中的互信息;根据所述互信息分别计算各候选实体的同现分数。7.根据权利要求5所述的方法,其特征在于,所述分别统计所述候选实体集合中各候选实体与所述种子在知识图谱中的关系权重,得到各候选实体的关系分数,包括:获取所述候选实体集合中各候选实体与所述种子在知识图谱中的关系边、以及关系边的权重;根据所述关系边和关系边的权重分别计算各候选实体的关系分数。8.根据权利要求5所述的方法,其特征在于,所述分别统计所述候选实体集合中各候选实体的实体上位词与所述种子的实体上位词的相关程度,得到各候选实体的相关分数,包括:分别确定所述候选实体集合中各候选实体的实体上位词集合与所述种子的实体上位词集合的交集;分别确定所述候选实体集合中各候选实体的实体上位词集合与所述种子的实体上位词集合的并集;根据确定的交集和并集计算各候选实体的相关分数。9.根据权利要求5所述的方法,其特征在于,所述根据所述同现分数、关系分数和相关分数分别计算各候选实体的推荐分数,包括:若候选实体是通过知识图谱获取得到的,则将所述...

【专利技术属性】
技术研发人员:李潇张锋王策
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1