当前位置: 首页 > 专利查询>东南大学专利>正文

一种基于深度交互推理模型的事实检测方法技术

技术编号:31570198 阅读:29 留言:0更新日期:2021-12-25 11:09
本发明专利技术公开了一种基于深度交互推理模型的事实检测方法,包括:使用BERT模型对证据和陈述分别进行编码;通过多头映射机制抽取证据的语义信息,并将其保存到记忆池中;计算陈述与每条证据之间的语义关系;基于注意力机制获取证据集合的整体表示,并计算陈述和证据整体表示之间的推理关系;将推理结构升级为多层结构,对推理关系进行迭代式地更新;利用更新后的证据表示对陈述的真实性进行判断。本发明专利技术方法中的多头映射机制能够从不同角度抽取证据的语义信息;记忆池结构赋予模型处理“多跳”问题的能力;多层推理结构能够深层次挖掘证据和陈述之间的推理关系。相比于其他方法,本发明专利技术方法在UKP

【技术实现步骤摘要】
一种基于深度交互推理模型的事实检测方法


[0001]本专利技术涉及自然语言处理领域,具体为一种基于深度交互推理模型的事实检测方法。

技术介绍

[0002]基于自然语言处理技术的事实检测旨在运用自然语言处理相关技术,自动判断信息的真实性。给定一个待验证真实性的语句——陈述,检测方法可以分为三个步骤:(1)文章检索:为了缩小搜索空间,基于陈述在知识库中检索出与陈述相关的文章集合,作为验证陈述的基础知识;(2)证据抽取:文章中往往包含较多噪声信息,因此需要进一步筛选出与陈述相关的证据集合,将证据粒度细化为句子级别,作为验证陈述的直接知识;(3)真假推理:基于证据集合通过自然语言处理方法和深度学习模型对陈述的真实性进行判断。在事实检测任务,文章检索方法和证据抽取方法都已经较为成熟,具有较高的召回率指标,目前大多数学者将研究重点放在真假推理阶段。
[0003]真假推理方法可以分为两类:(1)模型先获得证据集合的整体表示,然后结合陈述和整体表示对结果进行预测。在这类方法中,证据集合的整体表示是关键部分,如果由于存在噪声或不相关信息导致表示不准确,预本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度交互推理模型的事实检测方法,其特征在于:包括如下步骤:(1)使用BERT模型对陈述和证据分别进行编码;(2)通过多头映射机制抽取证据的语义信息,并将其保存到记忆池中;(3)计算陈述与每条证据之间的语义关系;基于注意力机制获取证据集合的整体表示,并计算陈述和证据整体表示之间的推理关系;(4)将推理结构升级为多层结构,对推理关系进行迭代式地更新;(5)通过单层前馈神经网络和softmax操作对陈述的真实性进行判断。2.根据权利要求1所述的一种基于深度交互推理模型的事实检测方法,其特征在于:所述步骤(1)中使用BERT模型对陈述和证据分别进行编码,具体包括:对于陈述c=[c1,c2,

,c
lc
],其中c
i
表示陈述中第i个单词,lc表示陈述的长度,其所对应的证据集合为E={e1,e2,...,e
M
},e
i
=[e
i,1
,e
i,2
,

,e
i,le
](1≤i≤M),其中e
i,j
表示第i条证据中第j个单词,le表示第i条证据的长度,M表示对应证据的数目;对于陈述和每条证据,分别输入到BERT模型中,得到陈述编码向量和证据编码向量{Emb1,Emb2,...,Emb
M
},如公式(1)、(2)所示,其中Emblen表示编码维度;Emb
c
=BERT(c1,c2,

c
lc
)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(1)Emb
i
=BERT(e
i,1
,e
i,2
,

e
i,le
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)3.根据权利要求1所述的一种基于深度交互推理模型的事实检测方法,其特征在于,所述步骤(2)中通过多头映射机制抽取证据的语义信息,并将其保存到记忆池中,具体包括:构造N个不同的映射矩阵来抽取证据中不同角度的信息,其中,Sublen=Emblen/N表示子空间的维度;通过映射矩阵将证据编码向量Emb
i
(1≤i≤M)映射到不同的子空间中,获取基于特定角度的特征表示,如公式(3)所示将不同子空间提取到的特征表示拼接起来,作为更新后的证据表示,如公式(4)所示,其中concat()函数表示拼接操作,其中concat()函数表示拼接操作,其中concat()函数表示拼接操作,将更新后的证据表示保存到记忆池中,如公式所示(5)所示,其中H={NewEmb1,NewEmb2,...,NewEmb
M
}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)。4.根据权利要求1所述的一种基于深度交互推理模型的事实检测方法,其特征在于,所述步骤(3)中计算陈述与每条证据之间的语义关系;基于注意力机制获取证据集合的整体表示,并计算陈述和证据整体表示之间的推理关系,具体包括:构造两个不同的嵌入矩阵和其中Memlen表示特征空间维度,将记忆池中证据的特征表示H映射到不同的特征空间中,从而获得所有证据的特征表示M
a
=[a1,a2,...,a
M
]和M
r
=[r1,r2,...,r
M
],如公式(6)、(7)所示,其中,
a
i
=NewEmb
i
·
A
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)r
i
=NewEmb
i
·
S
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)构造嵌入矩阵将陈述编码向量Emb
c
...

【专利技术属性】
技术研发人员:周德宇司加胜李同哲
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1