当前位置: 首页 > 专利查询>苏州大学专利>正文

一种跨篇章事实验证方法及系统技术方案

技术编号:44486512 阅读:29 留言:0更新日期:2025-03-04 17:51
本发明专利技术公开了一种跨篇章事实验证方法及系统,包括:采用BERT编码器获取数据集的第一语义嵌入特征及第二语义嵌入特征并构建句子图,利用自注意力机制处理句子图中的节点获取对应的预测结果;将预测结果与实际的句子标签进行拟合计算预测概率,并进行排序以得到最相关的句子作为证据句子;评估证据句子的重要程度,利用损失函数拟合评估结果与声明标签,并通过反向传播调整参数形成目标函数优化模型的学习结果。本发明专利技术解决了证据句子检索效率低下、事实验证缺乏可解释性的问题,设计了一种注意力机制可以使模型自动学习不同证据的重要程度,并且提出使用GAT捕获与黄金证据句子最相关的句子作为证据,捕获文本中的有效信息,有助于模型性能的提升。

【技术实现步骤摘要】

本专利技术涉及事实验证研究,具体为一种跨篇章事实验证方法及系统


技术介绍

1、跨篇章事实验证任务旨在从多个文件中检索相关证据,以验证给定索赔的真实性,依赖于检索证据的质量。社交媒体的显著进步不可避免地导致了假新闻和网络谣言的增加。为了减轻这种虚假陈述的负面影响,自动事实验证在最近的研究中引起了相当大的关注。事实验证旨在通过从可靠的语料库中检索相关证据来验证给定主张的真实性。具体来说,需要一个事实验证系统将一个主张标记为“支持”、“反驳”或“信息不足”,表明证据是否可以支持、反驳或不足以支持该主张。然而,现有的跨篇章事实验证方法严重依赖于特定的启发式或基于规则的策略,利用索赔和文件之间语义或表面形式的相似性度量来进行证据检索。因此,如何检索更可信的且更有利于验证声明事实性的证据句子,是跨篇章事实验证任务中的一个难题。

2、augenstein等人提出使用google返回的摘要片段作为证据。这种方法的一个关键限制是摘要片段不能提供足够的信息来验证声明。nie等人通过对句子的语义相似度排序,选择前k个句子作为证据。这种方法倾向于基于高相似度对句子进本文档来自技高网...

【技术保护点】

1.一种跨篇章事实验证方法,其特征在于,包括:

2.如权利要求1所述的跨篇章事实验证方法,其特征在于,所述采用BERT编码器获取数据集的第一语义嵌入特征及第二语义嵌入特征包括:

3.如权利要求2所述的跨篇章事实验证方法,其特征在于,所述构建句子图并利用自注意力机制处理所述句子图中的节点获取对应的预测结果包括:

4.如权利要求3所述的跨篇章事实验证方法,其特征在于,所述拟合计算预测概率包括:

5.如权利要求4所述的跨篇章事实验证方法,其特征在于,将通过对所述预测结果与实际的句子标签进行拟合计算获取的预测概率按照标签为1相关的概率从大到小进行排...

【技术特征摘要】

1.一种跨篇章事实验证方法,其特征在于,包括:

2.如权利要求1所述的跨篇章事实验证方法,其特征在于,所述采用bert编码器获取数据集的第一语义嵌入特征及第二语义嵌入特征包括:

3.如权利要求2所述的跨篇章事实验证方法,其特征在于,所述构建句子图并利用自注意力机制处理所述句子图中的节点获取对应的预测结果包括:

4.如权利要求3所述的跨篇章事实验证方法,其特征在于,所述拟合计算预测概率包括:

5.如权利要求4所述的跨篇章事实验证方法,其特征在于,将通过对所述预测结果与实际的句子标签进行拟合计算获取的预测概率按照标...

【专利技术属性】
技术研发人员:徐小曼钱忠
申请(专利权)人:苏州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1