【技术实现步骤摘要】
知识图谱的关系对齐方法、装置、设备及存储介质
本专利技术涉及人工智能领域,尤其涉及知识图谱的关系对齐方法、装置、设备及存储介质。
技术介绍
知识图谱技术日益成为人工智能的基础,它是机器理解自然语言和构建知识网络的重要方法。近年来,不同知识图谱融合悄然兴起,它帮助不同工作领域的工作人员检索相关内容,从而提高工作质量和效率。法律的知识体系非常复杂,是多种逻辑的结合。为了构建一个完备的知识体系,需要融合来自各领域的知识,并且知识体系会不断得到更新,在更新的过程中有新的实体和关系加入,如何将新的关系对应到现有的知识图谱中是一个难题和挑战。相同意义的关系可能有不同的表达方式,例如“的所属国家”和“的国籍”,相同的关系也有多种含义,例如<纽约,属于,美国>中的关系为地域关系(location-related)和<显示器,属于,电视机>中的关系为部分关系(composition-related)。但是目前还没有关于关系分类的相关研究,知识图谱中关系分类的效率低。
技术实现思路
本专利技术 ...
【技术保护点】
1.一种知识图谱的关系对齐方法,其特征在于,包括:/n获取知识图谱中的三元组数据,所述三元组包括主体,关系以及属性;/n通过预置的向量转换模型将所述三元组数据进行转换,得到每个关系的关系初始向量;/n通过预置的聚类算法对所有所述关系初始向量进行聚类,得到每个关系的关系聚类向量;/n通过所述预置的聚类算法对所述三元组数据中相同关系的所述初始关系向量进行聚类,得到每个关系的关系子向量;/n基于所述关系初始向量、所述关系聚类向量以及所述关系子向量,计算任意两个所述三元组中的关系之间的关系相似度;/n根据所述关系相似度对关系进行分类。/n
【技术特征摘要】
1.一种知识图谱的关系对齐方法,其特征在于,包括:
获取知识图谱中的三元组数据,所述三元组包括主体,关系以及属性;
通过预置的向量转换模型将所述三元组数据进行转换,得到每个关系的关系初始向量;
通过预置的聚类算法对所有所述关系初始向量进行聚类,得到每个关系的关系聚类向量;
通过所述预置的聚类算法对所述三元组数据中相同关系的所述初始关系向量进行聚类,得到每个关系的关系子向量;
基于所述关系初始向量、所述关系聚类向量以及所述关系子向量,计算任意两个所述三元组中的关系之间的关系相似度;
根据所述关系相似度对关系进行分类。
2.根据权利要求1所述的知识图谱的关系对齐方法,其特征在于,所述通过预置的向量转换模型将所述三元组数据进行转换,得到每个关系的关系初始向量,包括:
将目标三元组的主体和客体映射为低维度向量和所述目标三元组为所述三元组数据中任一三元组,i为所述三元组数据中三元组的总数量;
通过预置的损失函数调整和直至最小,其中
当所述最小时,将设置为向量型的所述目标三元组,所述为关系初始向量。
3.根据权利要求1所述的知识图谱的关系对齐方法,其特征在于,所述通过预置的聚类算法对所有所述关系初始向量进行聚类,得到每个关系的关系聚类向量,包括:
从所有所述关系初始向量中选取k个所述关系初始向量,作为第一质心向量,k为大于1的整数;
计算每个所述关系初始向量与k个所述第一质心向量之间的欧式距离,并确定每个所述关系初始向量的第一聚类向量,所述第一聚类向量为与一个所述关系初始向量欧式距离最小的所述第一质心向量;
将每个所述关系初始向量及对应的所述第一聚类向量,归为一个簇类,得到k个第一簇类;
基于均值原则,计算每个所述第一簇类的第二质心向量;
计算每个所述关系初始向量与k个所述第二质心向量之间的欧氏距离,并确定每个所述关系初始向量的第二聚类向量,所述第二聚类向量为与一个所述关系初始向量欧式距离最小的所述第二质心向量;
将每个所述关系初始向量及对应的所述第二聚类向量归为一个簇类,得到k个第二簇类;
基于均值原则,计算每个所述第二簇类的第三质心向量;
重复计算每个第N簇类的第N+1质心向量,直至所述第N质心向量与所述第N+1质心向量相同,将所述第N簇类作为k个聚类,将所述第N+1质心向量作为关系聚类向量,N为大于1的整数。
4.根据权利要求1所述的知识图谱的关系对齐方法,其特征在于,所述通过所述预置的聚类算法对所述三元组数据中相同关系的所述初始关系向量进行聚类,得到每个关系的关系子向量,包括:
从目标关系的所有所述初始关系向量中选取n个所述关系初始向量,作为n个第一子质心向量,所述目标关系为相同的至少一个关系,n为大于1的整数;
计算所述目标关系的每个关系初始向量与n个所述第一子质心向量之间的欧式距离,并确定所述目标关系的每个关系初始向量的第一子向量,所述第一子向量为与一个所述关系初始向量欧式距离最小的所述第一子质心向量;
将所述目标关系的每个关系初始向量与对应的所述第一子向量为一个子簇类,得到n个第一子簇类;
基于均值原则,计算每个所述第一子簇类的第二子质心向量;
计算所述目标关系的每...
【专利技术属性】
技术研发人员:凌岚,刘嘉伟,于修铭,陈晨,李可,汪伟,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。