一种融合节点的获取方法及装置制造方法及图纸

技术编号:38203580 阅读:11 留言:0更新日期:2023-07-21 16:48
本发明专利技术公开了一种融合节点的获取方法及装置,获取待融合节点的属性信息,获取目标节点的属性信息,目标节点包括待融合图谱中的节点,获取第一属性值和第二属性值的相似度,作为目标属性项的相似度,依据各个目标属性项的相似度,获取目标节点和待融合节点的相似度,将满足预设的相似度条件的目标节点作为待融合节点的融合节点。由于其中,属性信息包括多个预设的属性项的属性值,目标属性项包括待融合节点的属性信息和待融合节点的属性信息中相同的属性项,第一属性值包括待融合节点的目标属性项的属性值,第二属性值包括目标节点的目标属性项的属性值,多个目标属性项的相似度表征两个节点多个维度上的相似度,因此提高了融合节点的准确性。融合节点的准确性。融合节点的准确性。

【技术实现步骤摘要】
一种融合节点的获取方法及装置


[0001]本专利技术涉及自然语言处理
,更具体的说,涉及一种融合节点的获取方法及装置。

技术介绍

[0002]在知识图谱的管理与维护的过程中,涉及到外部节点或子图需要与主图谱合并,目前,通过节点的名称,对待融合节点(外部节点或子图中的节点)和图谱中的节点的融合概率进行计算,由此确定融合节点,显然,仅依据名称确定的融合概率的准确度较低,融合节点的准确性有待提高。

技术实现思路

[0003]鉴于上述问题,本专利技术提供一种克服上述问题或者至少部分地解决上述问题的融合节点的获取方法及装置,如下:
[0004]一种融合节点的获取方法,包括:
[0005]获取待融合节点的属性信息,所述属性信息包括多个预设的属性项的属性值;
[0006]获取目标节点的所述属性信息,所述目标节点包括待融合图谱中的节点;
[0007]获取第一属性值和第二属性值的相似度,作为目标属性项的相似度;所述第一属性值包括所述待融合节点的目标属性项的属性值,所述第二属性值包括所述目标节点的目标属性项的属性值,所述目标属性项包括所述待融合节点的属性信息和所述待融合节点的属性信息中相同的属性项;
[0008]依据各个所述目标属性项的相似度,获取所述目标节点和所述待融合节点的相似度;
[0009]将满足预设的相似度条件的目标节点作为所述待融合节点的融合节点,所述相似度条件包括与所述待融合节点的相似度大于第一预设阈值。
[0010]可选地,属性项包括:名称、类别和至少一项其他属性项,所述获取目标节点的所述属性信息之前,还包括:
[0011]获取所述待融合图谱中的每一节点的名称的属性值和类别的属性值;
[0012]获取所述待融合图谱中的每一节点的名称的属性值和所述待融合节点的名称的属性值的相似度,作为每一节点与所述待融合节点的名称相似度;
[0013]将满足预设的候选融合条件的节点作为目标节点,所述候选融合条件包括类别与所述待融合节点的类别相同,且与所述待融合节点的名称相似度大于第二预设阈值。
[0014]可选地,获取第一属性值和第二属性值的相似度,作为目标属性项的相似度,包括:
[0015]对所述第一属性值进行数值检测,以判断所述第一属性值是否包括数值;
[0016]若所述第一属性值包括数值,则获取所述第一属性值和所述第二属性值的文本相似度和数值相似度;
[0017]将所述文本相似度和所述数值相似度加权相加,得到所述第一属性值和所述第二属性值的相似度,作为所述目标属性项的相似度。
[0018]可选地,获取所述第一属性值和所述第二属性值的文本相似度,包括:
[0019]获取所述第一属性值和所述第二属性值的距离,作为所述第一属性值和所述第二属性值的第一文本相似度;
[0020]将第一词集合和第二词集合的相同序位的词的余弦相似度加权相加,得到所述第一属性值和所述第二属性值的第二文本相似度,所述第一词集合包括依序排列的所述第一属性值中的各个词的词向量,所述第二词集合包括依序排列的所述第二属性值中的各个词的词向量;
[0021]将第一目标词集合的词向量数量和第二目标词集合的词向量数量的比值,作为所述第一属性值和所述第二属性值的第三文本相似度,所述第一目标词集合为所述第一词集合和所述第二词集合的交集,所述第二目标词集合为所述第一词集合和所述第二词集合的并集;
[0022]将所述第一文本相似度、所述第二文本相似度、和所述第三文本相似度加权相加,得到所述第一属性值和所述第二属性值的文本相似度。
[0023]可选地,获取所述第一属性值和所述第二属性值的数值相似度包括:
[0024]获取所述第一属性值中的数值,作为第一数值;
[0025]获取所述第二属性值中的数值,作为第二数值;
[0026]获取所述第一数值和所述第二数值的差值;
[0027]依据所述差值,获取所述数值相似度,所述差值与所述数值相似度呈反相关。
[0028]可选地,依据各个所述目标属性项的相似度,获取所述目标节点和所述待融合节点的相似度,包括:
[0029]将各个所述目标属性项的相似度加权相加,得到所述目标节点和所述待融合节点的相似度。
[0030]一种融合节点的获取装置,包括:
[0031]第一属性获取单元,用于获取待融合节点的属性信息,所述属性信息包括多个预设的属性项的属性值;
[0032]第二属性获取单元,用于获取目标节点的所述属性信息,所述目标节点包括待融合图谱中的节点;
[0033]属性相似度获取单元,用于获取第一属性值和第二属性值的相似度,作为目标属性项的相似度;所述第一属性值包括所述待融合节点的目标属性项的属性值,所述第二属性值包括所述目标节点的目标属性项的属性值,所述目标属性项包括所述待融合节点的属性信息和所述待融合节点的属性信息中相同的属性项;
[0034]节点相似度获取单元,用于依据各个所述目标属性项的相似度,获取所述目标节点和所述待融合节点的相似度;
[0035]融合节点获取单元,用于将满足预设的相似度条件的目标节点作为所述待融合节点的融合节点,所述相似度条件包括与所述待融合节点的相似度大于第一预设阈值。
[0036]可选地,属性项包括:名称和类别,本装置还包括:目标节点获取单元,用于:
[0037]在所述获取目标节点的所述属性信息之前获取所述待融合图谱中的每一节点的
名称的属性值和类别的属性值;
[0038]获取所述待融合图谱中的每一节点的名称的属性值和所述待融合节点的名称的属性值的相似度,作为每一节点与所述待融合节点的名称相似度;
[0039]将满足预设的候选融合条件的节点作为目标节点,所述候选融合条件包括类别与所述待融合节点的类别相同,且与所述待融合节点的名称相似度大于第二预设阈值。
[0040]一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行任一项所述的融合节点的获取方法。
[0041]一种电子设备,设备包括至少一个处理器、以及与处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行任一项所述的融合节点的获取方法。
[0042]借由上述技术方案,本专利技术提供的一种融合节点的获取方法及装置,获取待融合节点的属性信息,获取目标节点的属性信息,目标节点包括待融合图谱中的节点,获取第一属性值和第二属性值的相似度,作为目标属性项的相似度,依据各个目标属性项的相似度,获取目标节点和待融合节点的相似度,将满足预设的相似度条件的目标节点作为待融合节点的融合节点。由于其中,属性信息包括多个预设的属性项的属性值,目标属性项包括待融合节点的属性信息和待融合节点的属性信息中相同的属性项,第一属性值包括待融合节点的目标属性项的属性值,第二属性值包括目标节点的目标属本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融合节点的获取方法,其特征在于,包括:获取待融合节点的属性信息,所述属性信息包括多个预设的属性项的属性值;获取目标节点的所述属性信息,所述目标节点包括待融合图谱中的节点;获取第一属性值和第二属性值的相似度,作为目标属性项的相似度;所述第一属性值包括所述待融合节点的目标属性项的属性值,所述第二属性值包括所述目标节点的目标属性项的属性值,所述目标属性项包括所述待融合节点的属性信息和所述待融合节点的属性信息中相同的属性项;依据各个所述目标属性项的相似度,获取所述目标节点和所述待融合节点的相似度;将满足预设的相似度条件的目标节点作为所述待融合节点的融合节点,所述相似度条件包括与所述待融合节点的相似度大于第一预设阈值。2.根据权利要求1所述的方法,其特征在于,所述属性项包括:名称、类别和至少一项其他属性项,所述获取目标节点的所述属性信息之前,还包括:获取所述待融合图谱中的每一节点的名称的属性值和类别的属性值;获取所述待融合图谱中的每一节点的名称的属性值和所述待融合节点的名称的属性值的相似度,作为每一节点与所述待融合节点的名称相似度;将满足预设的候选融合条件的节点作为目标节点,所述候选融合条件包括类别与所述待融合节点的类别相同,且与所述待融合节点的名称相似度大于第二预设阈值。3.根据权利要求1所述的方法,其特征在于,所述获取第一属性值和第二属性值的相似度,作为目标属性项的相似度,包括:对所述第一属性值进行数值检测,以判断所述第一属性值是否包括数值;若所述第一属性值包括数值,则获取所述第一属性值和所述第二属性值的文本相似度和数值相似度;将所述文本相似度和所述数值相似度加权相加,得到所述第一属性值和所述第二属性值的相似度,作为所述目标属性项的相似度。4.根据权利要求3所述的方法,其特征在于,所述获取所述第一属性值和所述第二属性值的文本相似度,包括:获取所述第一属性值和所述第二属性值的距离,作为所述第一属性值和所述第二属性值的第一文本相似度;将第一词集合和第二词集合的相同序位的词的余弦相似度加权相加,得到所述第一属性值和所述第二属性值的第二文本相似度,所述第一词集合包括依序排列的所述第一属性值中的各个词的词向量,所述第二词集合包括依序排列的所述第二属性值中的各个词的词向量;将第一目标词集合的词向量数量和第二目标词集合的词向量数量的比值,作为所述第一属性值和所述第二属性值的第三文本相似度,所述第一目标词集合为所述第一词集合和所述第二词集合的交集,所述第二目标词集合为所述第一词集合和所述第二词集合的并集;将所述第一文本相似度、所述第二文本相似度、和所述第三文本相似度加权相加,得到所述第一属性值...

【专利技术属性】
技术研发人员:葛婷
申请(专利权)人:苏州国双软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1