对实体链接模型的实体嵌入的强化及多义词歧义消除方法技术

技术编号:38751593 阅读:16 留言:0更新日期:2023-09-09 11:18
本发明专利技术公开了一种对实体链接模型的实体嵌入的强化及多义词歧义消除方法,其包括以下步骤:获取实体链接模型中待强化的实体嵌入;根据实体嵌入得到对应的实体类别列表;通过文本嵌入模型将类别名称转换为嵌入表示;统计每个类别在所有实体类别列表中的出现频次;根据出现频次对同一实体类别进行处理得到显著性系数;根据显著性系数对嵌入表示进行聚合得到更新后的实体嵌入;通过适配器网络对更新后的实体嵌入进行调整,得到强化后的实体嵌入;更新实体链接模型;基于更新后的实体链接模型进行多义词歧义消除。本发明专利技术通过完善实体嵌入的语义表达,提升相似实体的特异性,增加区分度,减少误判情况,降低实体链接的难度,提升实体链接的结果准确性。链接的结果准确性。链接的结果准确性。

【技术实现步骤摘要】
对实体链接模型的实体嵌入的强化及多义词歧义消除方法


[0001]本专利技术涉及语义识别
,具体涉及对实体链接模型的实体嵌入的强化方法及多义词歧义消除方法。

技术介绍

[0002]实体链接旨在将文本序列中的实体提及映射至已有知识库中唯一实体,本质上是利用文本的上下文环境来消除多义词的歧义。为了能将实体与文本环境建立关联,需要将知识库中的实体编码成含有语义信息的实体嵌入。与普通文本嵌入相比,实体嵌入拥有更加丰富且精准的预料信息,因此如何有效的利用知识库中实体的元数据构建实体嵌入会直接关系到实体链接的效果。
[0003]在过去的研究中,通常将实体描述文本直接利用编码来表示实体的语义。根据具体的实现方法主要分为两类,一是词向量化实体描述,并将词向量序列通过诸如拼接聚合的手段来得到实体嵌入。另一种方法则是通过特定模型,例如Bert模型直接将实体描述文本输出成实体嵌入,相较于前者,此类方法会对输入的长度进行限制。
[0004]上述两种方法,前者会因为长描述情况下,文本中的关键语义会被其他次要语义稀释。而后者会对长输入进行截断操作,从而丢失部分实体语义。这两种情况下,尤其是在相似实体中,都会降低实体嵌入语义的特异性,从而增加了实体链接的难度,导致多义词歧义消除难。

技术实现思路

[0005]针对现有技术中的上述不足,本专利技术提供的对实体链接模型的实体嵌入的强化方法及多义词歧义消除方法解决了现有技术会降低实体嵌入语义的特异性,从而导致难以消除歧义以及实体链接效果不好的问题。
[0006]为了达到上述专利技术目的,本专利技术采用的技术方案为:
[0007]提供了一种对实体链接模型的实体嵌入的强化及多义词歧义消除方法,其特征在于:包括以下步骤:
[0008]S1、获取实体链接模型中待强化的实体嵌入;根据实体名称获取实体对应知识库中的元数据并对其进行解析,得到对应的实体类别列表;
[0009]S2、通过文本嵌入模型将实体类别列表中的类别名称转换为与实体嵌入编码长度一致的嵌入表示;统计每个类别在所有实体类别列表中的出现频次;
[0010]S3、根据出现频次对同一实体类别列表的类别进行处理得到显著性系数;根据显著性系数将嵌入表示聚合至对应的实体类别列表中对应的实体嵌入表示处,得到更新后的实体嵌入;
[0011]S4、通过适配器网络对更新后的实体嵌入进行调整,得到调整后的实体嵌入并将其作为强化后的实体嵌入;
[0012]S5、将强化后的实体嵌入替换至实体链接模型,得到更新后的实体链接模型;
[0013]S6、基于更新后的实体链接模型进行多义词歧义消除。
[0014]进一步地,步骤S1中知识库采用Wikipedia维基百科作为目标知识库和强化信息的来源。
[0015]进一步地,实体链接模型采用mulrel

nel模型。
[0016]进一步地,步骤S2采用GloVe模型作为文本嵌入模型。
[0017]进一步地,步骤S2中嵌入表示的公式为:
[0018][0019][0020]其中,i表示第i个类别,j表示第j个实体,C
ij
表示第j个实体对应的第i个类别字面文本,表示第j个实体对应的类别列表中第i个类别的嵌入表示,k表示第k个分词,w
ikj
表示第j个实体对应的类别列表中第i个类别的第k个分词,c
ikj
表示w
ikj
对应的嵌入编码,GloVe(
·
)表示GloVe模型,MaxPooling(
·
)表示最大池化层,R表示实数,n表示嵌入向量的长度。
[0021]进一步地,步骤S3中更新后的实体嵌入的公式为:
[0022][0023][0024][0025]其中,i表示第i个类别,j表示第j个实体,k表示第k个分词,表示第j个实体对应的类别列表中第i个类别的嵌入表示,表示第j个实体对应的第k个类别字面文本,C
ij
表示第j个实体对应的第i个类别字面文本,表示C
ij
对应类别的显著性系数,t(
·
)表示括号内的类别在所有知识库中实体类别的出现频次,tanh(
·
)表示双曲正切,|C
j
|表示第j个实体对应类别列表的长度,e
j
表示第j个实体对应的原始嵌入,表示第j个实体对应的强化嵌入,||表示拼接,E
j
表示第j个实体对应的更新后的实体嵌入,R表示实数,n表示嵌入向量的长度。
[0026]进一步地,步骤S4中适配器网络包括串联的下采样层、多层感知器和l个线性层。
[0027]进一步地,步骤S4中适配器网络对更新后的实体嵌入进行调整的具体方法为:根据公式:
[0028]s1=W
down
·
E+b
down
[0029]s
l
=W
l
·
a
l
‑1+b
l
[0030]a
l
=GeLu(s
l
)
[0031]E
°
=s
lmax
+e
[0032]得到强化后的实体嵌入E
°
;其中,s1表示下采样后的特征向量,W
down
表示下采样层的权重矩阵,E表示更新后的实体嵌入,b
down
表示下采样层的偏置,s
l
表示第l层线性层输出
的特征向量,l表示层数,W
l
表示该线性层的权重矩阵,l
max
表示层数的最大值且值为6,a
l
‑1表示第l

1线性层输出的激活后的特征向量,b
l
表示该线性层的偏置,GeLu(
·
)表示激活函数,e表示原始嵌入,s
lmax
表示适配器网络最终输出的特征向量。
[0033]进一步地,步骤S5的多义词歧义消除的具体公式为:
[0034]R=EL(M,C,E
°
|D)
[0035]其中,D表示文档,M表示文档D对应的实体提及集合,C表示文档D对应的实体提及集合M对应的候选实体集合,E
°
表示强化后的实体嵌入,R表示经过实体链接消歧后的提及集M对应的结果集,EL(
·
)表示实体链接模型。
[0036]本专利技术的有益效果为:本专利技术通过利用易于获得的知识库元数据来完善实体嵌入的语义表达,提升相似实体的特异性,从而增加区分度,减少因为候选实体过于相似导致消歧结果的误判情况,降低实体链接的难度,提升实体链接中相似候选实体消歧的准确性。
附图说明
[0037]图1为本专利技术的具体流程图;
[0038]图2为本专利技术的强化嵌入流程图;
[0039]图3本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对实体链接模型的实体嵌入的强化及多义词歧义消除方法,其特征在于:包括以下步骤:S1、获取实体链接模型中待强化的实体嵌入;根据实体名称获取实体对应知识库中的元数据并对其进行解析,得到对应的实体类别列表;S2、通过文本嵌入模型将实体类别列表中的类别名称转换为与实体嵌入编码长度一致的嵌入表示;统计每个类别在所有实体类别列表中的出现频次;S3、根据出现频次对同一实体类别列表的类别进行处理得到显著性系数;根据显著性系数将嵌入表示聚合至对应的实体类别列表中对应的实体嵌入表示处,得到更新后的实体嵌入;S4、通过适配器网络对更新后的实体嵌入进行调整,得到调整后的实体嵌入并将其作为强化后的实体嵌入;S5、将强化后的实体嵌入替换至实体链接模型,得到更新后的实体链接模型;S6、基于更新后的实体链接模型进行多义词歧义消除。2.根据权利要求1所述的对实体链接模型的实体嵌入的强化及多义词歧义消除方法,其特征在于:所述步骤S1中知识库采用Wikipedia维基百科作为目标知识库和强化信息的来源。3.根据权利要求1所述的对实体链接模型的实体嵌入的强化及多义词歧义消除方法,其特征在于:所述实体链接模型采用mulrel

nel模型。4.根据权利要求1所述的对实体链接模型的实体嵌入的强化及多义词歧义消除方法,其特征在于:所述步骤S2采用GloVe模型作为文本嵌入模型。5.根据权利要求1所述的对实体链接模型的实体嵌入的强化及多义词歧义消除方法:所述步骤S2中嵌入表示的公式为:所述步骤S2中嵌入表示的公式为:其中,i表示第i个类别,j表示第j个实体,C
ij
表示第j个实体对应的第i个类别字面文本,表示第j个实体对应的类别列表中第i个类别的嵌入表示,k表示第k个分词,w
ikj
表示第j个实体对应的类别列表中第i个类别的第k个分词,c
ikj
表示w
ikj
对应的嵌入编码,GloVe(
·
)表示GloVe模型,MaxPooling(
·
)表示最大池化层,R表示实数,n表示嵌入向量的长度。6.根据权利要求1所述的对实体链接模型的实体嵌入的强化及多义词歧义消除方法,其特征在于:所述步骤S3中更新后的实体嵌入的公式为:其特征在于:所述步骤S3中更新后的实体嵌入的公式为:其特征在于:所述步骤S3中更新后的实体嵌入的公式为:
其中,i表示第i个类别,j表示第j个实体,k表示第k个分词,表示第j个实体对应的类别列表中第i个类别的嵌入表示,表示第j个实体对应的第k个类别字面文本,C
ij
表示第j个实体对应的第i个类别字面文本,表示C
ij

【专利技术属性】
技术研发人员:张栗粽惠孛田玲尹晓宇黄嘉豪杨筠
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1