一种基于事后验证的证据句去噪方法技术

技术编号:37858059 阅读:25 留言:0更新日期:2023-06-15 20:48
本发明专利技术涉及一种基于事后验证的证据句去噪方法,属于自然语言处理中的机器阅读理解技术领域。首先采用静态词向量为训练集进行伪证据标注,为标注数据训练模型,包括答案分类与证据句跨度预测,保存最优模型。根据最优模型预测获取候选证据列表。根据最优模型,对预测证据进行去噪。根据候选证据分数对候选证据进行重排,按要求选择最大分数候选证据作为最终证据句,重新评价后得到新证据准确率和总准确率,将它们与原准确率进行比较,衡量方法的有效性。本发明专利技术能够以小成本为模型进行证据去噪,在得到很好的效果的同时,还可应用于各种包含证据抽取任务的工作中。包含证据抽取任务的工作中。包含证据抽取任务的工作中。

【技术实现步骤摘要】
一种基于事后验证的证据句去噪方法


[0001]本专利技术涉及一种为证据句预测去除噪声的方法,属于自然语言处理中的机器阅读理解


技术介绍

[0002]近年来,随着深度神经网络模型的提出,机器阅读理解技术取得了明显的进步,被广泛应用于文本问答、信息抽取和机器翻译等多个方面,并且在某些任务上取得了超过人类的表现。
[0003]与此同时,深度模型的不透明性随着它们的参数与层数增加而增长,这促使人们努力解释这些“黑匣子”模型是如何工作的。因此,为了解释“这些模型是怎么选出正确答案的”和“正确答案是否是根据正确的依据选出的”等问题,一些工作采用手动标注文章中的证据句,以便让模型在预测正确答案的同时,也对其对应的证据句做出预测。
[0004]在机器阅读理解中,达成此目标的通用方法是使用同一模型同时进行答案预测与证据预测。但是,因为训练集与测试集的固有数据差异性会导致根据训练集训练的模型不能为测试集提供完全正确的证据预测,会出现答案预测准确但是证据预测错误的情况。此外,由于人工标注数据代价昂贵,特别是多选阅读理解中使用大部分伪证据标注本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于事后验证的证据句去噪方法,其特征在于,包括以下步骤:步骤1:采用静态词向量为训练集进行伪证据标注;步骤2:为标注数据训练模型,包括答案分类与证据句跨度预测,保存最优模型M0;步骤3:根据最优模型M0预测获取候选证据列表;步骤4:根据最优模型,对预测证据进行去噪;步骤5:根据候选证据分数对候选证据进行重排,按要求选择最大分数候选证据作为最终证据句,重新评价后得到新证据准确率和总准确率,将它们与原准确率进行比较,衡量方法的有效性。2.如权利要求1所述的一种基于事后验证的证据句去噪方法,其特征在于,步骤1中,将文章序列d中每个句子序列s
i
使用静态词向量表示平均后,得到句子一维向量s
i,vec
;对问题序列q和正确答案a
*
拼接后的新序列进行向量表示和平均后,得到一维向量qa
vec
;将s
i,vec
与qa
vec
进行余弦相似度计算,得到当前句子分数v
si
,选择具有最大分数句子作为证据句。3.如权利要求1所述的一种基于事后验证的证据句去噪方法,其特征在于,步骤2中,将文章序列d、问题序列q和每个候选答案a
j
进行拼接得到j个新序列t,输入至预训练模型中,得到U={u1,u2,

,u
j
},u
j
表示每个字符/标记的向量表示,使用一个线性层作为顶层分类器进行答案分类,损失函数为交叉熵损失,其中,分类器预测方式如下:p
j
=softmax(W
T
×
U0)其中,p
j
表示对问题的描述候选答案正确的概率,上标...

【专利技术属性】
技术研发人员:史树敏何苏哲
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1