数据推荐方法、装置、设备以及介质制造方法及图纸

技术编号:30403931 阅读:22 留言:0更新日期:2021-10-20 10:58
本申请实施例提供了一种数据推荐方法、装置、设备以及介质,该方法包括:获取与第一查询信息相关联的第一初始文本,根据第一初始文本对应的文本引用关系,获取第一初始文本对应的关联文本,构建包含第一初始文本和关联文本的引用关系图;根据引用关系图在关联文本和第一初始文本中,筛选第一查询信息对应的目标文本;在引用关系图中确定包含目标文本的最短文本阅读路径,根据最短文本阅读路径生成用于响应第一查询信息的第一推荐内容。采用本申请实施例,可以提高文本数据的推荐准确性。可以提高文本数据的推荐准确性。可以提高文本数据的推荐准确性。

【技术实现步骤摘要】
数据推荐方法、装置、设备以及介质


[0001]本申请涉及互联网
,尤其涉及一种数据推荐方法、装置、设备以及介质。

技术介绍

[0002]随着数据信息化的发展,数据量增长快速,大数据呈现出多元化、分散化的趋势。在大规模数据的环境下,大部分数据对于用户而言都是冗余的,用户可能只对某些信息感兴趣。例如,用户在做研究时,需要从大量的文献中查找自己需要的文献来阅读。
[0003]现有技术中,用户可以在搜索引擎中输入关键词,在搜索引擎中可以计算关键词与文献主题之间的相似度,并按照相似度对文献进行排序,进而可以根据排序为用户返回文献题目包含该关键词的文献。然而,基于关键词相似性进行推荐的文献,往往只是文献题目中包含用户所输入的关键词,文献内容并不是用户想要的内容,而真正与用户意图最贴切的文献可能在题目中不包含用户输入的关键字,进而造成为用户推荐的文献准确率过低。

技术实现思路

[0004]本申请实施例提供一种数据推荐方法、装置、设备以及介质,可以提高文本数据的推荐准确性。
[0005]本申请实施例一方面提供了一种数据推荐本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据推荐方法,其特征在于,包括:获取与第一查询信息相关联的第一初始文本,根据所述第一初始文本对应的文本引用关系,获取所述第一初始文本对应的关联文本,构建包含所述第一初始文本和所述关联文本的引用关系图;根据所述引用关系图在所述关联文本和所述第一初始文本中,筛选所述第一查询信息对应的目标文本;在所述引用关系图中确定包含所述目标文本的最短文本阅读路径,根据所述最短文本阅读路径生成用于响应所述第一查询信息的第一推荐内容。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一初始文本对应的文本引用关系,获取所述第一初始文本对应的关联文本,构建包含所述第一初始文本和所述关联文本的引用关系图,包括:根据所述第一初始文本对应的文本引用关系,获取所述第一初始文本对应的引用文本和被引用文本,将所述引用文本和所述被引用文本确定为所述关联文本;将所述第一初始文本和所述关联文本均确定为文本节点,根据所述文本节点之间的文本引用关系,构建包含所述文本节点的引用关系图。3.根据权利要求1所述的方法,其特征在于,所述根据所述引用关系图在所述关联文本和所述第一初始文本中,筛选所述第一查询信息对应的目标文本,包括:将所述第一初始文本和所述关联文本均确定为文本节点,在所述引用关系图中获取所述文本节点对应的被引用文本数量;若存在所述被引用文本数量大于数量阈值的文本节点,则将被引用文本数量大于所述数量阈值的文本节点,确定为所述第一查询信息对应的目标文本。4.根据权利要求1所述的方法,其特征在于,所述在所述引用关系图中确定包含所述目标文本的最短文本阅读路径,包括:获取所述引用关系图对应的文本推荐权重和边权重,在所述引用关系图中构建包含所述目标文本的M个初始文本阅读路径;所述边权重用于表征所述引用关系图中具有文本引用关系的两个文本之间的关联性,M为正整数;根据所述M个初始文本阅读路径分别包含的文本推荐权重和边权重,确定所述M个初始文本阅读路径分别对应的权重累加值;在所述M个初始文本阅读路径中,将最小的权重累加值所对应的初始文本阅读路径确定为所述最短文本阅读路径。5.根据权利要求1所述的方法,其特征在于,所述在所述引用关系图中确定包含所述目标文本的最短文本阅读路径,包括:获取所述引用关系图对应的文本推荐权重和边权重,在所述引用关系图中构建包含所述目标文本的第一文本子图;所述边权重用于表征所述引用关系图中具有文本引用关系的两个文本之间的关联性;根据所述第一文本子图中所包含的边权重和文本推荐权重,获取所述第一文本子图中的第一最小生成树;所述第一最小生成树是指所述第一文本子图中具有最小权重累加值的生成树,所述第一最小生成树包括所述目标文本,所述第一文本子图中的最小权重累加值是指所述第一最小生成树中的文本推荐权重和边权重的累加值;
在所述引用关系图中构建包含所述目标文本的第二文本子图,根据所述第二文本子图中所包含的文本推荐权重和边权重,对所述第一最小生成树进行更新,生成所述第二文本子图中的第二最小生成树;所述第二最小生成树是指所述第二文本子图中具有最小权重累加值的生成树,所述第二最小生成树对应的权重累加值小于所述第一最小生成树对应的权重累加值,所述第二最小生成树包括所述目标文本,所述第二文本子图中的最小权重累加值是指所述第二最小生成树中的文本推荐权重和边权重的累加值;若所述第二最小生成树为所述引用关系图中具有最小权重累加值的生成树,则将所述第二最小生成树确定为所述最短文本阅读路径。6.根据权利要求4或5所述的方法,其特征在于,所述获取所述引用关系图对应的文本推荐权重和边权重,包括:将所述第一初始文本和所述关联文本均确定为所述引用关系图中的文本节点,获取所述文本节点对应的文本排序数值和评级特征,根据所述文本排序数值和所述评级特征,确定所述文本节点对应的文本推荐权重;在所述引用关系图中获取具有文本引用关系的文本节点v
i
和文本节点v
j

【专利技术属性】
技术研发人员:欧子菁赵瑞辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1