问题解答模型的训练与问题解答方法、装置制造方法及图纸

技术编号:41146887 阅读:16 留言:0更新日期:2024-04-30 18:14
本公开提供一种问题解答模型的训练与问题解答方法、装置、电子设备与可读存储介质。问题解答模型的训练方法包括:获取第一样本问题;将第一样本问题与解答步骤抓取模板输入大语言模型获取第一样本解答步骤;将第一样本问题、第一样本解答步骤与回答抓取模板输入大语言模型获取第一样本回答;根据第一样本问题与第一样本解答步骤对步骤规划模型进行预训练;根据第一样本问题、第一样本解答步骤与第一样本回答对大语言模型进行预训练;根据预训练得到的步骤规划模型与大语言模型,获取问题解答模型。问题解答方法包括:获取待解答问题;将待解答问题输入步骤规划模型获取解答步骤;将待解答问题与解答步骤输入大语言模型获取回答。

【技术实现步骤摘要】

本公开涉及计算机,尤其涉及大模型、自然语言处理、深度学习等人工智能。提供了一种问题解答模型的训练与问题解答方法、装置、电子设备与可读存储介质。


技术介绍

1、大语言模型(large language model,llm)是指使用大量文本数据训练得到的深度学习模型,可以生成自然语言文本或理解自然语言文本的含义等。大语言模型具有一定的推理能力,使得大语言模型能够对所输入的问题进行解答,从而获取问题的回答。但是现有技术中的大语言模型在通过推理解答问题时,存在获取的回答的准确性较低的问题。


技术实现思路

1、根据本公开的第一方面,提供了一种问题解答模型的训练方法,包括:获取第一样本问题;将所述第一样本问题与解答步骤抓取模板输入大语言模型,获取所述大语言模型输出的第一样本解答步骤;将所述第一样本问题、所述第一样本解答步骤与回答抓取模板输入所述大语言模型,获取所述大语言模型输出的第一样本回答;根据所述第一样本问题与所述第一样本解答步骤,对步骤规划模型进行预训练;根据所述第一样本问题、所述第一样本解答步骤与所述第一样本回答本文档来自技高网...

【技术保护点】

1.一种问题解答模型的训练方法,包括:

2.根据权利要求1所述的方法,还包括,

3.根据权利要求2所述的方法,其中,所述将所述第一样本问题、所述第一样本解答步骤与所述第一样本回答作为预训练数据包括:

4.根据权利要求1所述的方法,其中,所述根据预训练得到的步骤规划模型与大语言模型,获取问题解答模型包括:

5.根据权利要求1所述的方法,其中,所述根据预训练得到的步骤规划模型与大语言模型,获取问题解答模型包括:

6.根据权利要求1所述的方法,其中,所述根据预训练得到的步骤规划模型与大语言模型,获取问题解答模型包括

7....

【技术特征摘要】

1.一种问题解答模型的训练方法,包括:

2.根据权利要求1所述的方法,还包括,

3.根据权利要求2所述的方法,其中,所述将所述第一样本问题、所述第一样本解答步骤与所述第一样本回答作为预训练数据包括:

4.根据权利要求1所述的方法,其中,所述根据预训练得到的步骤规划模型与大语言模型,获取问题解答模型包括:

5.根据权利要求1所述的方法,其中,所述根据预训练得到的步骤规划模型与大语言模型,获取问题解答模型包括:

6.根据权利要求1所述的方法,其中,所述根据预训练得到的步骤规划模型与大语言模型,获取问题解答模型包括:

7.根据权利要求1所述的方法,其中,所述根据所述第一样本问题与所述第一样本解答步骤,对步骤规划模型进行预训练包括:

8.根据权利要求1所述的方法,其中,所述根据所述第一样本问题、所述第一样本解答步骤与所述第一样本回答,对所述大语言模型进行预训练包括:

9.一种问题解答方法,包括:

10.一种问题解答模型的训练装置,包括:

11.根据权利要求10所述的装置,所述第二处理单元还用于执行:

12.根据权利要求11所述的装置,其中,所述第二处理单元在将所述第一样本问题、所述第一样本解答步骤与所述第...

【专利技术属性】
技术研发人员:贺峰王建华欧俊杰黄枰轩冯知凡崔骁鹏佘俏俏吴华
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1