一种路径的向量化表征方法、装置、计算设备及存储介质制造方法及图纸

技术编号:30433565 阅读:18 留言:0更新日期:2021-10-24 17:30
本申请实施例提供了一种路径的向量化表征方法、装置、计算设备及存储介质,该方法包括:确定待嵌入路径的字段维度的第一输入编码,以及所述待嵌入路径的字符维度的第二输入编码;上述第一输入编码是根据所述待嵌入路径中的所有字段的输入编码确定的,待嵌入路径中的字段包括实体字段和/或关系字段;第二输入编码是根据所述待嵌入路径中的所有字符的输入编码确定的;将所述第一输入编码以及所述第二输入编码输入双流架构的嵌入模型,得到所述嵌入模型输出的表征所述待嵌入路径语义的目标向量。上述方法通过双流架构的嵌入模型融合字段和字符两个维度的特征,基于上述两个维度进行语义提取,所得到的目标向量能够精准地表征待嵌入路径的语义。征待嵌入路径的语义。征待嵌入路径的语义。

【技术实现步骤摘要】
一种路径的向量化表征方法、装置、计算设备及存储介质


[0001]本申请实施例涉及知识图谱领域,尤其涉及一种路径的向量化表征方法、装置、计算设备及存储介质。

技术介绍

[0002]知识图谱是一种基于有向图结构的知识库,可以描述真实世界中存在的各种实体及其关系。知识图谱嵌入技术(即知识的向量化表征),将知识中的实体和关系映射到向量空间,从而应用于各种任务中,例如:可采用知识图谱支撑问答引擎。
[0003]相关技术中,通过提取用户输入的路径(知识)中实体和关系维度的语义信息,得到该路径所对应的向量,用该向量来表征输入路径(进行知识图谱嵌入)。
[0004]然而,上述方案仅提取路径中实体和关系这一维度的语义信息,得到的向量难以精准表示对应的路径的语义。

技术实现思路

[0005]本申请实施例提供了一种路径的向量化表征方法、装置、计算设备及存储介质,用以精准地对路径进行向量化表征。
[0006]第一方面,本申请实施例提供了一种路径的向量化表征方法,该方法包括:
[0007]确定待嵌入路径的字段维度的第一输入编码,以及所述待嵌入路径的字符维度的第二输入编码;其中,所述第一输入编码是根据所述待嵌入路径中的所有字段的输入编码确定的,所述待嵌入路径中的字段包括实体字段和/或关系字段;所述第二输入编码是根据所述待嵌入路径中的所有字符的输入编码确定的;
[0008]将所述第一输入编码以及所述第二输入编码输入双流架构的嵌入模型,得到所述嵌入模型输出的表征所述待嵌入路径语义的目标向量。<br/>[0009]上述技术方案中,通过确定待嵌入路径的字段维度的第一输入编码以及字符维度的第二输入编码;进而通过双流架构的嵌入模型融合字段和字符两个维度的特征,基于上述两个维度进行语义提取,所得到的目标向量能够精准地表征待嵌入路径的语义。
[0010]可选地,所述嵌入模型包括M层图谱嵌入注意力编码器;将所述第一输入编码以及所述第二输入编码输入双流架构的嵌入模型,得到所述嵌入模型输出的表征所述待嵌入路径语义的目标向量,包括:
[0011]通过第N层图谱嵌入注意力编码器,将第(N

1)个字段维度的向量以及第(N

1)个字符维度的向量进行特征融合,得到第N个字段维度的向量以及第N个字符维度的向量;若N=1,则第(N

1)个字段维度的向量为所述第一输入编码,第(N

1)个字符维度的向量为所述第二输入编码;
[0012]若N为1到(M

1)之间的正整数,则将所述第N个字段维度的向量以及第N个字符维度的向量输出至第(N+1)层图谱嵌入注意力编码器;若N=M,则从所述第N个字段维度的向量中选择目标位置的子向量作为所述目标向量。
[0013]上述技术方案中,通过设置多层图谱嵌入注意力编码器,每一层图谱嵌入注意力编码器均会对字段维度的向量与字符维度的向量之间进行特征融合,充分基于上述两个维度进行语义提取,从而使最后一层图谱嵌入注意力编码器输出的字段维度的向量的目标位置的子向量,能够更加精准地表征待嵌入路径的语义。
[0014]可选地,将第(N

1)个字段维度的向量以及第(N

1)个字符维度的向量进行特征融合,得到第N个字段维度的向量以及第N个字符维度的向量,包括:
[0015]将第(N

1)个字符维度的向量经过注意力层运算,得到第N个字符维度的中间特征;对第N个字符维度的中间特征进行全连接层运算,得到第N个字符维度的向量;以及
[0016]基于对第(N

1)个字符维度的向量进行降维处理得到的降维向量,对第(N

1)个字段维度的向量进行调整,得到第N个调整向量;对第N个调整向量进行注意力层运算,得到第N个字段维度的中间特征;对第N个字段维度的中间特征进行全连接层运算,得到第N个字段维度的向量。
[0017]上述技术方案中,各层图谱嵌入注意力编码器通过对该层接收的字符维度的向量进行注意力层以及全连接层运算,得到输出至下一层的字符维度的向量;通过对该层接收的字符维度的向量进行降维处理,得到与字段维度的向量维数匹配的降维向量,并基于该降维向量对该层接收的字段维度的向量进行调整,从而对实现了特征融合的调整向量,进行注意力层以及全连接层运算,得到特征融合后的字段维度的向量。
[0018]可选地,通过以下方式得到所述待嵌入路径中的任一字段的输入编码:
[0019]根据预设的字段与编码的对应关系,确定所述字段所对应的字段编码;
[0020]根据所述字段的字段编码,以及表征所述字段在所述待嵌入路径中位置的编码,得到所述字段的输入编码。
[0021]上述技术方案中,由于各字段的字段编码表征了对应字段的语义,各字段的位置的编码表征了对应字段在待嵌入路径中的位置,因此,通过上述方式得到字段的输入编码,同时表征了该字段的语义以及在待嵌入路径中位置,从而使后续较好地学习该字段的特征。
[0022]可选地,通过以下方式得到所述待嵌入路径中的任一字符的输入编码:
[0023]根据所述字符在自然语言中的编码,以及表征所述字符在所述待嵌入路径中位置的编码,得到所述字符的输入编码。
[0024]上述技术方案中,由于各字符在自然语言中的编码表征了对应字符的语义,各字符的位置的编码表征了对应字符在待嵌入路径中的位置,因此,通过上述方式得到字符的输入编码,同时表征了该字符的语义以及在待嵌入路径中位置,从而使后续较好地学习该字符的特征。
[0025]可选地,所述待嵌入路径为单跳路径或者多跳路径。
[0026]上述技术方案中,待嵌入路径既可以为单跳路径,也可以为多跳路径,从而更加灵活地嵌入不同形式的路径。
[0027]可选地,在得到所述嵌入模型输出的表征所述待嵌入路径语义的目标向量之后,还包括:
[0028]在确定所述目标向量与目标图谱中已有的各路径的语义向量的相似度均低于相似度阈值后,将所述待嵌入路径加入所述目标图谱。
[0029]上述技术方案中,在得到上述目标向量后就完成了待嵌入路径的嵌入过程,由于目标向量表征了待嵌入路径的语义,因此,在目标图谱需要添加该路径时,先确定该路径对应的目标向量与目标图谱中已有的各路径的语义向量的相似度均低于相似度阈值,即确定上述待嵌入路径的语义与目标图谱中已有的各路径的语义均不相似,才会将该路径加入目标图谱,避免了将语义相似的路径重复加入到目标图谱中。
[0030]第二方面,本申请实施例还提供了一种路径的向量化表征装置,包括:
[0031]编码确定模块,用于确定待嵌入路径的字段维度的第一输入编码,以及所述待嵌入路径的字符维度的第二输入编码;其中,所述第一输入编码是根据所述待嵌入路径中的所有字段的输入编码确定的,所述待嵌入路径中的字段包括实体字段和/或关系字段;所述第二输入编码是根据所述待嵌入路径中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种路径的向量化表征方法,其特征在于,该方法包括:确定待嵌入路径的字段维度的第一输入编码,以及所述待嵌入路径的字符维度的第二输入编码;其中,所述第一输入编码是根据所述待嵌入路径中的所有字段的输入编码确定的,所述待嵌入路径中的字段包括实体字段和/或关系字段;所述第二输入编码是根据所述待嵌入路径中的所有字符的输入编码确定的;将所述第一输入编码以及所述第二输入编码输入双流架构的嵌入模型,得到所述嵌入模型输出的表征所述待嵌入路径语义的目标向量。2.如权利要求1所述的方法,其特征在于,所述嵌入模型包括M层图谱嵌入注意力编码器;将所述第一输入编码以及所述第二输入编码输入双流架构的嵌入模型,得到所述嵌入模型输出的表征所述待嵌入路径语义的目标向量,包括:通过第N层图谱嵌入注意力编码器,将第(N

1)个字段维度的向量以及第(N

1)个字符维度的向量进行特征融合,得到第N个字段维度的向量以及第N个字符维度的向量;若N=1,则第(N

1)个字段维度的向量为所述第一输入编码,第(N

1)个字符维度的向量为所述第二输入编码;若N为1到(M

1)之间的正整数,则将所述第N个字段维度的向量以及第N个字符维度的向量输出至第(N+1)层图谱嵌入注意力编码器;若N=M,则从所述第N个字段维度的向量中选择目标位置的子向量作为所述目标向量。3.如权利要求2所述的方法,其特征在于,将第(N

1)个字段维度的向量以及第(N

1)个字符维度的向量进行特征融合,得到第N个字段维度的向量以及第N个字符维度的向量,包括:将第(N

1)个字符维度的向量经过注意力层运算,得到第N个字符维度的中间特征;对第N个字符维度的中间特征进行全连接层运算,得到第N个字符维度的向量;以及基于对第(N

1)个字符维度的向量进行降维处理得到的降维向量,对第(N

【专利技术属性】
技术研发人员:李钊赵凯邓晓雨刘岩宋慧驹
申请(专利权)人:泰康保险集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1