【技术实现步骤摘要】
本专利技术涉及一种基于大模型的文档问答的训练样本构造方法和装置,属于人工智能自然语言生成。
技术介绍
1、基于gpt大模型的文档问答模型基于问题和指定文档,从文档中找到问题的答案。由于大模型蕴含了大量的先验知识,效果提升较为明显,同时带来的负面作用是gpt基础模型一般会产生较强的幻觉,常常不根据文档进行问答或给出的答案与标准答案无关。实际应用过程中,需要根据特定行业的文档集构造训练样本对gpt基础模型进行微调,以提升文档问答的准确率。
2、常规的训练样本构造一般是基于文档集构造问题-答案对,此种方法费时费力,且需要对文档内容有很强的专业理解能力才可构造,门槛较高。公开的相关专利《自由文档问答语料标注方法》,采用训练好的传统bert方法根据问题生成答案的方式辅助进行标注,模型根据问题给出参考答案,人工进行确定参考答案的质量。此过程问题部分仍然需要人工进行联想,而这恰恰是最耗费工作量的部分,其次仍然需要预先构造训练样本对传统bert进行训练。相关专利《文档问答对拆分方法、装置、电子设备及存储介质》目的是通过预训练的模型对文档进行
...【技术保护点】
1.一种基于大模型的文档问答的训练样本构造方法,其特征在于,包括:
2.根据权利要求1所述的基于大模型的文档问答的训练样本构造方法,其特征在于,所述基础文档集包括如下形式:每一个文档为原始独立文档、每一个文档为拼接文档或每一个文档为拆分文档。
3.根据权利要求1所述的基于大模型的文档问答的训练样本构造方法,其特征在于,所述判断{}中的A是否在中具体方式如下:
4.根据权利要求3所述的基于大模型的文档问答的训练样本构造方法,其特征在于,所述检查对于{}中{}的生成质量具体方式如下:
5.根据权利要求4所述的基于大模型的文档
...【技术特征摘要】
1.一种基于大模型的文档问答的训练样本构造方法,其特征在于,包括:
2.根据权利要求1所述的基于大模型的文档问答的训练样本构造方法,其特征在于,所述基础文档集包括如下形式:每一个文档为原始独立文档、每一个文档为拼接文档或每一个文档为拆分文档。
3.根据权利要求1所述的基于大模型的文档问答的训练样本构造方法,其特征在于,所述判断{}中的a是否在中具体方式如下:
4.根据权利要求3所述的基于大模型的文档问答的训练样本构造方法,其特征在于,所述检查对于{}中{}的生成质量具体方式如下:
5.根据权利要求4所述的基于大模型的文档问答的训练样本构造方法,其特征在于,所述对{}中的进行泛化具体方式如下:
6.根据权利要求5所述...
【专利技术属性】
技术研发人员:张传锋,闵万里,丁鑫,田钿,
申请(专利权)人:神思电子技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。