【技术实现步骤摘要】
知识图谱构建、信息推荐方法、装置和计算机设备
[0001]本申请涉及互联网
,特别是涉及一种知识图谱构建、信息推荐方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
[0002]随着人工智能技术的发展,出现了知识图谱技术,知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。目前,在对用户的兴趣进行刻画时,通常是以用户画像来表征用户兴趣特征。然而,通过用户画像来表征用户兴趣特征可能会存在用户兴趣遗漏的情况,存在对用户兴趣表征准确性低的问题。
技术实现思路
[0003]基于此,有必要针对上述技术问题,提供一种能够提高用户兴趣表征准确性的知识图谱构建、信息推荐方法、装置、计算机设备、存储介质和计算机程序产品。
[0004]一种知识图谱构建方法,所述方法包括:
[0005]获取目标用户标识在预设时间段的阅读文本,基于阅 ...
【技术保护点】
【技术特征摘要】
1.一种知识图谱构建方法,其特征在于,所述方法包括:获取目标用户标识在预设时间段的阅读文本,基于所述阅读文本进行实体链接,得到所述阅读文本对应的实例实体集;基于所述实例实体集中各个实例实体进行实例拓展,得到拓展实例实体集,基于所述拓展实例实体集和所述实例实体集得到目标实例实体集,并基于所述目标实例实体集中各个目标实例实体进行概念拓展,得到拓展概念实体集;获取各个实例实体权重,所述各个实例实体权重是指所述各个实例实体在所述阅读文本和在所述预设时间段之前的目标时间段的目标阅读文本中的出现次数;计算所述各个拓展实例实体分别与所述各个实例实体中关联的实例实体之间的实例相似程度,使用所述各个实例实体权重和所述实例相似程度进行拓展实例实体权重计算,得到各个拓展实例实体权重;计算所述拓展概念实体集中各个拓展概念实体分别与所述各个目标实例实体中关联的目标实例实体之间的概念相似程度,使用所述各个实例实体权重、所述各个拓展实例实体权重和所述概念相似程度进行拓展概念实体权重计算,得到各个拓展概念实体权重;基于所述目标实例实体集、所述拓展概念实体集、所述各个实例实体权重、所述各个拓展实例实体权重和所述各个拓展概念实体权重建立所述目标用户标识对应的兴趣知识图谱。2.根据权利要求1所述的方法,其特征在于,所述基于所述阅读文本进行实体链接,得到所述阅读文本对应的实例实体集,包括:基于所述阅读文本进行实体词识别,得到各个实体词;基于所述各个实体词从预设知识库中进行实体召回,得到所述各个实体词分别对应的候选实体集;基于所述各个实体词分别对应的候选实体集进行实体消歧,得到所述各个实体词分别对应的实体,基于所述各个实体词分别对应的实体得到所述阅读文本对应的实例实体集。3.根据权利要求2所述的方法,其特征在于,所述基于所述各个实体词分别对应的候选实体集进行实体消歧,得到所述各个实体词分别对应的实体,包括:从所述各个实体词中确定当前实体词,并获取当前实体词对应的实体文本;将所述实体文本和对应的候选实体集输入到实体消歧模型中,所述实体消歧模型分别将所述实体文本和对应的候选实体集映射到向量空间中,得到所述当前实体词对应的实体词向量和所述候选实体集对应的候选实体向量集,计算实体词向量分别与所述候选实体向量集中候选实体向量的相似程度,基于所述相似程度从所述候选实体集中确定所述当前实体词对应的当前实体。4.根据权利要求1所述的方法,其特征在于,所述基于所述实例实体集中各个实例实体进行实例拓展,得到拓展实例实体集,包括:从所述实例实体集中确定当前实例实体,使用所述当前实例实体按照预设关联关系在预设知识库中查找关联的各个候选实例实体;计算所述当前实例实体分别与所述各个候选实例实体的实例相似程度,基于所述实例相似程度从所述各个候选实例实体中选取所述当前实例实体关联的拓展实例实体;遍历所述实例实体集中的各个实例实体,得到所述拓展实例实体集。
5.根据权利要求1所述的方法,其特征在于,所述基于所述目标实例实体集中各个目标实例实体进行概念拓展,得到拓展概念实体集,包括:获取实例关系和子类关系,按照所述实例关系在预设知识库中基于所述各个目标实例实体进行概念拓展,得到第一拓展概念实体集;按照所述子类关系在所述预设知识库中基于所述第一拓展概念实体集中各个第一拓展概念实体进行概念拓展,得到所述第二拓展概念实体集;基于所述第一拓展概念实体集和所述第二拓展概念实体集得到所述拓展概念实体集。6.根据权利要求5所述的方法,其特征在于,所述按照所述实例关系在预设知识库中基于所述各个目标实例实体进行概念拓展,得到第一拓展概念实体集,包括:从所述各个目标实例实体中确定当前目标实例实体,使用所述当前目标实例实体按照所述实例关系在预设知识库中查找关联的各个第一候选拓展概念实体;计算所述当前目标实例实体分别与所述各个第一候选拓展概念实体的第一概念相似程度,基于所述第一概念相似程度从所述各个第一候选拓展概念实体中选取所述当前目标实例实体对应的第一拓展概念实体;遍历所述目标实例实体集中的各个目标实例实体,得到第一拓展概念实体集。7.根据权利要求5所述的方法,其特征在于,所述按照所述子类关系在所述预设知识库中基于所述第一拓展概念实体集中各个第一拓展概念实体进行概念拓展,得到所述第二拓展概念实体集,包括:从所述第一拓展概念实体集中确定当前第一拓展概念实体,使用所述当前第一拓展概念实体按照所述子类关系在所述预设知识库中查找关联的各个第二候选拓展概念实体;计算所述当前第一拓展概念实体分别与所述各个第二候选拓展概念实体的第二概念相似程度,基于所述第二概念相似程度从所述各个第二候选拓展概念实体中选取所述当前第一拓展概念实体对应的第二拓展概念实体;遍历所述第一拓展概念实体集中的各个第一拓展概念实体,得到第二拓展概念实体集。8.根据权利要求1所述的方法,其特征在于,所述计算所述各个拓展实例实体分别与所述各个实例实体中关联的实例实体之间的实例相似程度,使用所述各个实例实体权重和所述实例相似程度进行拓展实例实体权重计算,得到各个拓展实例实体权重,包括:从所述各个拓展实例实体中确定当前拓展实例实体,并从所述各个实例实体中确定与所述当前拓展实例实体关联的实例实体;从所述各个实例实体权重中得到所述关联的实例实体对应的关联实例实体权重,并从所述实例相似程度中确定所述当前拓展实例实体与所述关联的实例实体之间的关联实例相似程度;计算所述关联实例实体权重与所述关联实例相似程度的乘积,得到所述当前拓展实例实体对应的拓展实例权重;遍历所述各个拓展实例实体,得到所述各个拓展实例实体权重。9.根据权利要求1所述的方法,其特征在于,所述计算所述拓展概念实体集中各个拓展概念实体分别与所述各个目标实例实体中关联的目标实例实体之间的概念相似程度,使用所述各个实例实体权重、所述各个拓展实例实体权重和所述概念相似程度进行拓展概念实
体权重计算,得到各个拓展概念实体权重,包括:从所述各个拓展概念实体中确定第一拓展概念实体集和第二拓展概念实体集,所述第一拓展概念实体集是基于所述目标实例实体集通过预设实例关系得到的,所述第二拓展概念实体集是基于所述第一拓展概念实体集通过预设子类关系得到的;计算所述第一拓展概念实体集中各个第一拓展概念实体分别与所述各个目标实例实体中关联的目标实例实体之间的第一概念相似程度,从所述各个实例实体权重和所述各个拓展实例实体权重中确定所述各个第一拓展概念实体关联的目标实例实体权重,基于所述第一概念相似程度和所述关联的目标实例实体权重进行第一拓展概念实体权重计算,得到各个第一拓展概念实体权重;计算所述第二拓展概念实体集中各个第二拓展概念实体分别与所述各个第一拓展概念实体中关联的第一拓展概念实体之间的第二概念相似程度,从所述各个第一拓展概念实体权重中确定所述各个第二拓展概念实体关联的第一拓展概念实体权重,基于所述第二概念相似程度和所述关联的第一拓展概念实体权重进行第二拓展概念实体权重计算,得到各个第二拓展概念实体权重;基于所述各个第一拓展概念实体权重和所述各个第二拓展概念实体权重得到所述各个拓展概念实体权重。10.根据权利要求9所述的方法,其特征在于,所述计算所述第一拓展概念实体集中各个第一拓展概念实体分别与所述各个目标实例实体中关联的目标实例实体之间的第一概念相似程度,从所述各个实例实体权重和所述各个拓展实例实体权重中确定所述各个第一拓展概念实体关联的目标实例实体权重,基于所述第一概念相似程度和所述关联的目标实例实体权重进行第一拓展概念实体权重计算,得到各个第一拓展概念实体权重,包括:从所述各个第一拓展概念实体中确定当前第一拓展概念实体,并从所述各个目标实例实体中确定与所述当前第一拓展概念实体关联的当前目标实例实体;计算所述当前第一拓展概念实...
【专利技术属性】
技术研发人员:徐朕燃,单子非,王成浩,户保田,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。