知识图谱的数据增强方法、装置及电子设备制造方法及图纸

技术编号:39249138 阅读:27 留言:0更新日期:2023-10-30 12:01
本发明专利技术提供了一种知识图谱的数据增强方法、装置及电子设备,获取待处理知识图谱;其实体之间的关系为双向关系;逻辑规则为关系路径到关系的映射;采用随机游走的方式,获取逻辑规则和数据分布信息,进而遍历待处理知识图谱中的每个已有三元组,针对每个已有三元组,确定该已有三元组对应的至少一个候选三元组;计算每个候选三元组的分值,以确定其对应的增强三元组,并更新至待处理知识图谱中。该方式定义了待处理知识图谱中的逻辑规则,并采用随机游走的方式,学习该逻辑规则和待处理知识图谱中的数据分布信息,再利用学习到的逻辑规则和数据分布信息对待处理知识图谱进行数据增强,可以达到充分利用信息、提升辅助预测准确度的目的。目的。目的。

【技术实现步骤摘要】
知识图谱的数据增强方法、装置及电子设备


[0001]本专利技术涉及数据处理
,尤其是涉及一种知识图谱的数据增强方法、装置及电子设备。

技术介绍

[0002]近年来,知识图谱作为一种存储知识的大规模数据库得到了迅速地发展,并且借助于表示学习广泛应用于搜索引擎、对话系统、商品推荐以及各类垂直领域等。然而,由于几乎所有知识图谱都存在着不完整的问题,已有的表示学习方法不能学习到完全包含实体语义信息的向量表示,这使得在应用知识图谱时存在着信息利用不充分、辅助预测不准确的问题。

技术实现思路

[0003]本专利技术的目的在于提供一种知识图谱的数据增强方法、装置及电子设备,以改善知识图谱存在的信息利用不充分、辅助预测不准确的问题。
[0004]本专利技术提供的一种知识图谱的数据增强方法,方法包括:获取待处理知识图谱;其中,待处理知识图谱中实体之间的关系为双向关系;待处理知识图谱中的逻辑规则为关系路径到关系的映射;采用随机游走的方式,获取逻辑规则和数据分布信息;其中,数据分布信息包括:待处理知识图谱中的关系的分布、关系路径的分布、本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种知识图谱的数据增强方法,其特征在于,所述方法包括:获取待处理知识图谱;其中,所述待处理知识图谱中实体之间的关系为双向关系;所述待处理知识图谱中的逻辑规则为关系路径到关系的映射;采用随机游走的方式,获取所述逻辑规则和数据分布信息;其中,所述数据分布信息包括:所述待处理知识图谱中的关系的分布、关系路径的分布、已有关系路径下头实体和尾实体的分布,以及已有三元组下规则体的分布;根据所述逻辑规则和所述数据分布信息,遍历所述待处理知识图谱中的每个已有三元组,针对每个所述已有三元组,确定该已有三元组对应的至少一个候选三元组;计算每个所述候选三元组的分值,根据每个所述候选三元组的分值确定该已有三元组对应的增强三元组,将所述增强三元组更新至所述待处理知识图谱中。2.根据权利要求1所述的方法,其特征在于,采用随机游走的方式,获取所述逻辑规则和数据分布信息的步骤包括:采用随机游走的方式获取所述逻辑规则;遍历所述待处理知识图谱中的每个已有三元组,针对每个所述已有三元组,采用随机游走的方式,得到出发于该已有三元组的头实体并结束于该已有三元组的尾实体的至少一条路径;从得到的所述至少一条路径中抽取出规则体,得到该已有三元组下规则体的分布;更新所述待处理知识图谱中的关系的分布、关系路径的分布、已有关系路径下头实体和尾实体的分布。3.根据权利要求2所述的方法,其特征在于,更新所述待处理知识图谱中的关系的分布、关系路径的分布、已有关系路径下头实体和尾实体的分布的步骤包括:基于该已有三元组下规则体的分布,更新每种规则头的频率,每种规则体的频率、每种规则体下规则头的频率,每种规则体下头实体的频率和尾实体的频率;在遍历完成每个已有三元组后,对每种规则头的频率,每种规则体的频率、每种规则体下规则头的频率,每种规则体下头实体的频率和尾实体的频率分别进行归一化处理,得到所述待处理知识图谱中的关系的分布、关系路径的分布、已有关系路径下头实体和尾实体的分布。4.根据权利要求1所述的方法,其特征在于,针对每个所述已有三元组,确定该已有三元组对应的至少一个候选三元组的步骤包括:针对每个所述已有三元组,查询该已有三元组下规则体的分布;针对该已有三元组下的每个所述规则体,查询该规则体下头实体的分布、尾实体的分布和规则头的分布;根据该已有三元组下所有规则体对应的规则头、头实体和尾实体,构成至少一个候选三元组。5.根据权利要求1所述的方法,其特征在于,计算每个所述候选三元组的分值的步骤包括:采用以下公式计算每个所述候选三元组的分值:
;其中,(x,r,y)表示该已有三元组;x表示该...

【专利技术属性】
技术研发人员:张建伟刘靖楠姜东基
申请(专利权)人:首都信息发展股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1