【技术实现步骤摘要】
一种知识图谱融合方法和装置及设备
[0001]本专利技术涉及计算机
,尤其涉及一种知识图谱融合方法和装置及设备。
技术介绍
[0002]知识图谱,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系,通常包括实体、关系及属性。在使用知识图谱时,例如,应用知识图谱进行知识问答等,经常需要利用知识图谱融合方法更新知识图谱。知识图谱融合,指将同一个实体或概念的描述信息融合起来,以合并两个知识图谱,或将包括实体、关系和/或属性的三元组集合合并到知识图谱中,其中涉及到等价的实体、关系、属性的对齐。
[0003]相关技术中使用(1)编辑距离,例如莱文斯坦Levenstein距离、Wagner and Fisher距离、Edit Distance with Afine Gaps距离等;(2)集合相似度,例如杰卡德Jaccard系数,Dice系数等;(3)基于向量的相似度,例如,余弦Cosine相似度、词频逆向文件频率(Term Freque ...
【技术保护点】
【技术特征摘要】
1.一种知识图谱融合方法,其特征在于,包括:提取第一待融合数据的第一图谱元素和第一图谱路径,及第二待融合数据的第二图谱元素和第二图谱路径;针对各第一图谱路径对应的各第一路径特征,根据该第一路径特征的第一相似度集合,确定所述各第一图谱路径中符合第一融合条件的第三图谱路径;其中,所述第一路径特征的第一相似度集合包括所述第一路径特征与各第二图谱路径对应的各第二路径特征之间的第一相似度;针对各第一图谱元素对应的各第一元素特征,根据该第一元素特征的第二相似度集合,确定所述第三图谱路径中符合第二融合条件的待融合图谱路径;其中,所述第一元素特征的第二相似度集合包括所述第一元素特征与各第二图谱元素对应的各第二元素特征之间的第二相似度;将所述待融合图谱路径对应的第一待融合数据与所述第二待融合数据进行融合。2.根据权利要求1所述的方法,其特征在于,采用如下方式确定所述第一路径特征的第一相似度集合:针对任意一个所述第一路径特征,通过第一特征搜索引擎确定所述第一路径特征与所述各第二路径特征之间的第一相似度,并基于确定的各所述第一相似度得到所述第一路径特征的第一相似度集合;采用如下方式确定所述第一元素特征的第二相似度集合:针对任意一个所述第一元素特征,通过第二特征搜索引擎确定所述第一元素特征与所述各第二元素特征之间的第二相似度,并基于确定的各所述第二相似度得到所述第一元素特征的第二相似度集合。3.根据权利要求1所述的方法,其特征在于,根据该第一路径特征的第一相似度集合,确定所述各第一图谱路径中符合第一融合条件的第三图谱路径,包括:遍历该第一路径特征的第一相似度集合,比较各第一相似度和第一预设阈值的大小;若不存在大于所述第一预设阈值的第一相似度,则确定该第一路径特征对应的第一图谱路径符合第一融合条件。4.根据权利要求1所述的方法,其特征在于,根据该第一元素特征的第二相似度集合,确定所述第三图谱路径中符合第二融合条件的待融合图谱路径,包括:遍历该第一元素特征的第二相似度集合,比较各第二相似度和第二预设阈值的大小;若存在大于所述第二预设阈值的第二相似度,则确定包括该第一元素特征的第三图谱路径符合第二融合条件。5.根据权利要求1所述的方法,其特征在于,将所述待融合图谱路径对应的第一待融合数据与所述第二待融合数据进行融合,包括:针对各待融合图谱路径,确定该待融合图谱路径包括的图谱元素中的目标图谱元素;其中,所述目标图谱元素对应的第二相似度集合中存在大于所述第二预设阈值的第二相似度;针对各目标图谱元素,在该目标...
【专利技术属性】
技术研发人员:李钊,赵凯,邓晓雨,刘岩,宋慧驹,
申请(专利权)人:泰康保险集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。