一种基于prompt的表格事实检测方法技术

技术编号:36402238 阅读:61 留言:0更新日期:2023-01-18 10:09
本发明专利技术属于自然语言处理技术领域,尤其是涉及一种基于prompt的表格事实检测方法。本发明专利技术首次在表格事实检测任务上使用Prompt方法,在小样本或零样本情况下有效的提高判断效果。首先是将表格事实检测任务形式改造成和预训练表格模型一致,不需要在预训练模型的基础上做过多训练;其次是定义了一个多组的映射关系,可以方便的将prompt的预测结果转化为表格事实检测结果。事实检测结果。事实检测结果。

【技术实现步骤摘要】
一种基于prompt的表格事实检测方法


[0001]本专利技术属于自然语言处理
,尤其是涉及一种基于prompt的表格事实检测方法。

技术介绍

[0002]在自然语言处理领域中,有一种针对表格的任务,称作表格事实检测。表格事实检测是一项分类任务,旨在给出一个文本陈述和一个与之相关的表格,需要根据表格内容去判断陈述是否成立。
[0003]现有的表格事实检测任务通常采用的方法都是基于预训练模型的微调,可以大致描述为下列流程:
[0004]1.使用大量的文本、表格等相关语料训练一个预训练模型,这个模型将学习到表格、文本的一些通用表征。
[0005]2.将训练好的预训练模型应用到表格事实检测任务下。通常的做法是,将表格和相关的陈述文本输入到预训练模型中,得到一个表格和文本的向量表示,该向量中将包含了模型在预训练阶段学习到的知识。
[0006]3.在得到预训练模型输出的表格和文本的向量表示后,再使用该向量继续做表格事实检测任务,最后采用数据集中相应数据的标签进行有监督学习,计算出损失并使用损失微调模型网络。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于prompt的表格事实检测方法,其特征在于,包括以下步骤:S1、对用于表格事实检测的数据集进行处理获得第一数据,第一数据的格式为(表格,文本,标签);S2、从第一数据中抽取表格数据,拉平后作为第二数据;S3、从第一数据中抽取文本数据输入prompt模块中,获得第三数据;S4、将第二数据和第三数据拼接后输入预训练预测模型中,得到预测结果;S5、利用得到的预测结果根据映射关系,得到表格事实检测结果。2.根据权利要求1所述的一种基于prompt的表格事实检测方法,其特征在于,步骤S3的具体方法为:通过定义prompt模板,将表格事实检测任务改造成遮盖词预测任务;根据定义的p...

【专利技术属性】
技术研发人员:侯磊刘昱博宋元凤张廷意石微微陈思芹吴洁侯孟书
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1