元数据关系提取的建模方法、提取方法及相关设备技术

技术编号:39195369 阅读:15 留言:0更新日期:2023-10-27 08:42
本公开实施例提供了一种元数据关系提取的建模方法、元数据关系的提取方法、装置、计算机设备、可读存储介质及程序,涉及计算机技术领域。该方法包括:获取元数据和与元数据对应的句子;根据所述元数据和所述元数据对应的句子获取共性掩码矩阵和个性掩码矩阵;将所述元数据输入第一BERT模型以获取元数据表示;将所述句子输入第二BERT模型以获取句子表示;根据所述元数据表示、所述句子表示和所述共性掩码矩阵获取共性表示;根据所述句子表示和所述个性掩码矩阵获取个性表示;根据所述共性表示和所述个性表示获取所述元数据的关系。本公开实施例提供的元数据关系提取的建模方法,能够获取元数据的关系的元数据关系提取模型。取元数据的关系的元数据关系提取模型。取元数据的关系的元数据关系提取模型。

【技术实现步骤摘要】
元数据关系提取的建模方法、提取方法及相关设备


[0001]本公开涉及计算机
,尤其涉及一种元数据关系提取的建模方法、元数据关系的提取方法、装置、计算机设备、可读存储介质及程序。

技术介绍

[0002]目前,针对句子中实体对间的关系抽取技术目前主要集中于利用大规模训练语料,基于BERT预训练模型进行关系分类。然而对于元数据来说,首先数据量无法满足构建数据集的基本要求,人工标注额外数据集耗费大量成本;其次元数据作为一种特殊的表达形式,相比句子而言存在形式及语义的差异,很难直接将句子关系抽取模型迁移到元数据上。

技术实现思路

[0003]本公开实施例提供了一种元数据关系提取的建模方法、元数据关系的提取方法、装置、计算机设备、可读存储介质及程序,涉及计算机
,建立的元数据关系提取模型,能够获取元数据的关系。
[0004]本公开实施例提供了一种元数据关系提取的建模方法,包括:获取元数据和与元数据对应的句子;根据所述元数据和所述元数据对应的句子获取共性掩码矩阵和个性掩码矩阵;将所述元数据输入第一BERT模型以获取元数据表示;将所述句子输入第二BERT模型以获取句子表示;根据所述元数据表示、所述句子表示和所述共性掩码矩阵获取共性表示;根据所述句子表示和所述个性掩码矩阵获取个性表示;根据所述共性表示和所述个性表示获取所述元数据的关系。
[0005]在一个实施例中,获取元数据和与元数据对应的句子包括:获取与所述元数据相关的数据文档;将所述数据文档拆分成与元数据对应的句子。
[0006]在一个实施例中,根据所述元数据和所述元数据对应的句子获取共性掩码矩阵和个性掩码矩阵包括:将所述元数据和所述元数据对应的句子输入至编码解码模型;根据所述编码解码模型中注意力权重获取所述共性掩码矩阵;根据所述编码解码模型输出的与所述元数据的句子对应的序列与所述元数据的句子的原始表示的损失获取所述个性掩码矩阵。
[0007]在一个实施例中,根据所述元数据表示、所述句子表示和所述共性掩码矩阵获取共性表示包括:根据所述元数据表示和所述句子表示计算每个隐藏层的分数;根据每个隐藏层的分数计算第一注意力矩阵;根据所述第一注意力矩阵、所述句子表示和所述共性掩码矩阵获取句子中间表示;将所述句子中间表示和所述元数据表示输入第三BERT模型以获取所述共性表示。
[0008]在一个实施例中,根据所述句子表示和所述个性掩码矩阵获取个性表示包括:根据所述句子表示计算每个隐藏层的分数;根据每个隐藏层的分数计算第二注意力矩阵;根据所述第二注意力矩阵、所述句子表示和所述个性掩码矩阵获取所述个性表示。
[0009]在一个实施例中,根据所述共性表示和所述个性表示获取所述元数据的关系包
括:根据所述共性表示和所述个性表示通过柔性最大值传输函数softmax获取所述元数据的关系。
[0010]本公开实施例提供了一种7元数据关系的提取方法,包括:获取元数据;将所述元数据输入至通过训练的元数据关系提取模型以提取所述元数据的关系;其中所述元数据关系提取模型是如上建模方法中任一项所述的方法所建立的元数据关系提取模型。
[0011]本公开实施例提供了一种元数据关系提取的建模装置,包括:第一获取模块,用于获取元数据和与元数据对应的句子;掩码模块,用于根据所述元数据和所述元数据对应的句子获取共性掩码矩阵和个性掩码矩阵;元数据表示模块,用于将所述元数据输入第一BERT模型以获取元数据表示;句子表示模块,用于将所述句子输入第二BERT模型以获取句子表示;共性表示模块,用于根据所述元数据表示、所述句子表示和所述共性掩码矩阵获取共性表示;个性表示模块,用于根据所述句子表示和所述个性掩码矩阵获取个性表示;元数据的关系模块,用于根据所述共性表示和所述个性表示获取所述元数据的关系。
[0012]本公开实施例提供了一种元数据关系的提取装置,包括:第二获取模块,用于获取元数据;提取模块,用于将所述元数据输入至通过训练的元数据关系提取模型以提取所述元数据的关系;其中所述元数据关系提取模型是上建模方法中任一项所述的方法所建立的元数据关系提取模型。
[0013]本公开实施例提供了一种计算机设备,包括处理器、存储器、输入输出接口;所述处理器分别与所述存储器和所述输入输出接口相连,其中,所述输入输出接口用于接收数据及输出数据,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以使得所述计算机设备执行如上实施例中任一项所述的方法。
[0014]本公开实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于由处理器加载并执行,以使得具有所述处理器的计算机设备执行上实施例中任一项所述的方法。
[0015]本公开实施例提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上实施例中任一项所述的方法。
[0016]本申请的元数据关系提取的建模方法,通过获取元数据和与元数据对应的句子;根据所述元数据和所述元数据对应的句子获取共性掩码矩阵和个性掩码矩阵;将所述元数据输入第一BERT模型以获取元数据表示;将所述句子输入第二BERT模型以获取句子表示;根据所述元数据表示、所述句子表示和所述共性掩码矩阵获取共性表示;根据所述句子表示和所述个性掩码矩阵获取个性表示;根据所述共性表示和所述个性表示获取所述元数据的关系,从而建立能够获取元数据的关系的元数据关系提取模型。
附图说明
[0017]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1示出了可以应用本公开实施方式的元数据关系提取的建模方法的示例性系统架构的示意图;
[0019]图2是本公开实施例提供的一种元数据关系提取的建模方法的流程图;
[0020]图3是本公开实施例提供的一种获取元数据和与元数据对应的句子方法的流程图;
[0021]图4是本公开实施例提供的一种根据所述元数据和所述元数据对应的句子获取共性掩码矩阵和个性掩码矩阵方法的流程图;
[0022]图5是本公开实施例提供的一种根据所述元数据表示、所述句子表示和所述共性掩码矩阵获取共性表示方法的流程图;
[0023]图6是本公开实施例提供的一种根据所述句子表示和所述个性掩码矩阵获取个性表示方法的流程图;
[0024]图7是本公开实施例提供的一种元数据关系的提取方法的流程图;
[0025]图8是本公开实施例提供的一种元数据关系提取的建模装置的结构示意图;
[0026]图9是本公开实施例提供的一种元数据关系的提取装置的结构示意图;
[0027]图10是本公开实施例提供的一种计算机设备的结构示意图。
具体实施方式
[0028]下面将结合本公开实施例中的附本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种元数据关系提取的建模方法,其特征在于,包括:获取元数据和与元数据对应的句子;根据所述元数据和所述元数据对应的句子获取共性掩码矩阵和个性掩码矩阵;将所述元数据输入第一BERT模型以获取元数据表示;将所述句子输入第二BERT模型以获取句子表示;根据所述元数据表示、所述句子表示和所述共性掩码矩阵获取共性表示;根据所述句子表示和所述个性掩码矩阵获取个性表示;根据所述共性表示和所述个性表示获取所述元数据的关系。2.根据权利要求1所述的方法,其特征在于,获取元数据和与元数据对应的句子包括:获取与所述元数据相关的数据文档;将所述数据文档拆分成与元数据对应的句子。3.根据权利要求1所述的方法,其特征在于,根据所述元数据和所述元数据对应的句子获取共性掩码矩阵和个性掩码矩阵包括:将所述元数据和所述元数据对应的句子输入至编码解码模型;根据所述编码解码模型中注意力权重获取所述共性掩码矩阵;根据所述编码解码模型输出的与所述元数据的句子对应的序列与所述元数据的句子的原始表示的损失获取所述个性掩码矩阵。4.根据权利要求1所述的方法,其特征在于,根据所述元数据表示、所述句子表示和所述共性掩码矩阵获取共性表示包括:根据所述元数据表示和所述句子表示计算每个隐藏层的分数;根据每个隐藏层的分数计算第一注意力矩阵;根据所述第一注意力矩阵、所述句子表示和所述共性掩码矩阵获取句子中间表示;将所述句子中间表示和所述元数据表示输入第三BERT模型以获取所述共性表示。5.根据权利要求1所述的方法,其特征在于,根据所述句子表示和所述个性掩码矩阵获取个性表示包括:根据所述句子表示计算每个隐藏层的分数;根据每个隐藏层的分数计算第二注意力矩阵;根据所述第二注意力矩阵、所述句子表示和所述个性掩码矩阵获取所述个性表示。6.根据权利要求1所述的方法,其特征在于,根据所述共性表示和所述个性表示获取所述元数据的关系包括:根据所述共性表示和所述个性表示通过柔性最大值传输函数softmax获取所述元数据的关系。7.一种元数据关系的提取方法,其特征在于,包括:获取元...

【专利技术属性】
技术研发人员:郭枝虾常可冯大全陈萌蔡兴健
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1