一种基于大模型的文档问答的训练样本构造方法和装置制造方法及图纸

技术编号:40660708 阅读:29 留言:0更新日期:2024-03-18 18:53
本发明专利技术提供了一种基于大模型的文档问答的训练样本构造方法和装置,属于人工智能自然语言生成技术领域。本发明专利技术利用大模型海量先验知识,通过构造prompt集和链式推理过程,自动构造一批高质量训练样本,包括:准备基础文档集,构造问答对生成的prompt生成指令指定的问答对格式的数据集,对基于数据集进行蕴含关系判断、质量判断和泛化判断构造相似问题集,对问题集进行质量判断和扩充得到训练样本。此过程无需人工编写样本,可生成质量与人工编写相媲美的样本,大大了降低构造训练样本的门槛,提升了研发人员的工作效率和工作质量。

【技术实现步骤摘要】

本专利技术涉及一种基于大模型的文档问答的训练样本构造方法和装置,属于人工智能自然语言生成。


技术介绍

1、基于gpt大模型的文档问答模型基于问题和指定文档,从文档中找到问题的答案。由于大模型蕴含了大量的先验知识,效果提升较为明显,同时带来的负面作用是gpt基础模型一般会产生较强的幻觉,常常不根据文档进行问答或给出的答案与标准答案无关。实际应用过程中,需要根据特定行业的文档集构造训练样本对gpt基础模型进行微调,以提升文档问答的准确率。

2、常规的训练样本构造一般是基于文档集构造问题-答案对,此种方法费时费力,且需要对文档内容有很强的专业理解能力才可构造,门槛较高。公开的相关专利《自由文档问答语料标注方法》,采用训练好的传统bert方法根据问题生成答案的方式辅助进行标注,模型根据问题给出参考答案,人工进行确定参考答案的质量。此过程问题部分仍然需要人工进行联想,而这恰恰是最耗费工作量的部分,其次仍然需要预先构造训练样本对传统bert进行训练。相关专利《文档问答对拆分方法、装置、电子设备及存储介质》目的是通过预训练的模型对文档进行编码及解码操作,得到本文档来自技高网...

【技术保护点】

1.一种基于大模型的文档问答的训练样本构造方法,其特征在于,包括:

2.根据权利要求1所述的基于大模型的文档问答的训练样本构造方法,其特征在于,所述基础文档集包括如下形式:每一个文档为原始独立文档、每一个文档为拼接文档或每一个文档为拆分文档。

3.根据权利要求1所述的基于大模型的文档问答的训练样本构造方法,其特征在于,所述判断{}中的A是否在中具体方式如下:

4.根据权利要求3所述的基于大模型的文档问答的训练样本构造方法,其特征在于,所述检查对于{}中{}的生成质量具体方式如下:

5.根据权利要求4所述的基于大模型的文档问答的训练样本构造方...

【技术特征摘要】

1.一种基于大模型的文档问答的训练样本构造方法,其特征在于,包括:

2.根据权利要求1所述的基于大模型的文档问答的训练样本构造方法,其特征在于,所述基础文档集包括如下形式:每一个文档为原始独立文档、每一个文档为拼接文档或每一个文档为拆分文档。

3.根据权利要求1所述的基于大模型的文档问答的训练样本构造方法,其特征在于,所述判断{}中的a是否在中具体方式如下:

4.根据权利要求3所述的基于大模型的文档问答的训练样本构造方法,其特征在于,所述检查对于{}中{}的生成质量具体方式如下:

5.根据权利要求4所述的基于大模型的文档问答的训练样本构造方法,其特征在于,所述对{}中的进行泛化具体方式如下:

6.根据权利要求5所述...

【专利技术属性】
技术研发人员:张传锋闵万里丁鑫田钿
申请(专利权)人:神思电子技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1