System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机,特别是涉及一种文本生成方法、装置、电子设备及存储介质。
技术介绍
1、在人工智能领域,大语言模型是大型语言模型(large language modeling,llm)的简称,是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义,大语言模型可以处理多种自然语言任务,例如文本分类、问答、对话等。
2、目前,在处理对话任务时,虽然大语言模型具备较优的文本理解和生成能力,但是在许多情况下,大语言模型生成的响应文本会出现错误,导致响应文本的生成效果较差,大语言模型的泛化性能较低。
技术实现思路
1、以下是对本申请详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
2、本申请实施例提供了一种文本生成方法、装置、电子设备及存储介质,能够提高大语言模型的泛化性能,从而生成效果较好的响应文本。
3、一方面,本申请实施例提供了一种文本生成方法,包括:
4、获取多个轮次的历史对话文本、多个预设的候选文本和各个所述候选文本对应的参考知识文本,在多个所述候选文本中筛选出与所述历史对话文本相似的目标文本;
5、根据所述目标文本和对应的所述参考知识文本构建第一提示文本,根据所述历史对话文本构建第二提示文本,其中,所述第一提示文本用于提示所述目标文本与对应的所述参考知识文本之间的关联关系,所述第二提示文本用于提示生成所述历史对话文本的预测知识文本;
6、将所述第一提示文本和所述第二提
7、将多个轮次的历史对话文本与所述预测知识文本进行拼接,得到目标拼接文本,将所述目标拼接文本输入所述大语言模型进行文本预测,生成当前轮次的响应文本。
8、另一方面,本申请实施例还提供了一种文本生成装置,包括:
9、获取模块,用于获取多个轮次的历史对话文本、多个预设的候选文本和各个所述候选文本对应的参考知识文本,在多个所述候选文本中筛选出与所述历史对话文本相似的目标文本;
10、提示构建模块,用于根据所述目标文本和对应的所述参考知识文本构建第一提示文本,根据所述历史对话文本构建第二提示文本,其中,所述第一提示文本用于提示所述目标文本与对应的所述参考知识文本之间的关联关系,所述第二提示文本用于提示生成所述历史对话文本的预测知识文本;
11、知识生成模块,用于将所述第一提示文本和所述第二提示文本拼接后输入大语言模型进行文本预测,生成所述预测知识文本;
12、回复生成模块,用于将多个轮次的历史对话文本与所述预测知识文本进行拼接,得到目标拼接文本,将所述目标拼接文本输入所述大语言模型进行文本预测,生成当前轮次的响应文本。
13、进一步,所述候选文本的知识粒度类型的数量为至少一种,上述获取模块具体用于:
14、在多个轮次的所述历史对话文本中提取出查询文本,其中,所述查询文本包括至少两个轮次的所述历史对话文本,或者包括单个轮次的所述历史对话文本;
15、在所述知识粒度类型与所述查询文本对应的所述候选文本中,筛选出与所述查询文本相似的目标文本。
16、进一步,所述参考知识文本的知识粒度类型包括第一知识粒度类型和第二知识粒度类型,所述第一知识粒度类型的粒度范围大于所述第二知识粒度类型的粒度范围,上述获取模块具体用于:
17、在所述第一知识粒度类型的所述候选文本中,筛选出与至少两个轮次的所述历史对话文本相似的目标文本;
18、在所述第二知识粒度类型的所述候选文本中,筛选出与单个轮次的所述历史对话文本相似的目标文本。
19、进一步,所述预测知识文本包括所述第一知识粒度类型对应的第一知识文本,以及所述第二知识粒度类型对应的第二知识文本,上述回复生成模块具体用于:
20、根据所述第一知识文本构建第一背景文本;
21、将最后至少两个轮次的所述历史对话文本分别与对应的所述第二知识文本进行拼接,得到各个轮次的所述历史对话文本对应的第一拼接文本;
22、按照轮次顺序将各个轮次的所述第一拼接文本依次进行拼接,得到第二拼接文本;
23、将所述第一背景文本和所述第二拼接文本进行拼接,得到目标拼接文本。
24、进一步,所述预测知识文本包括所述第一知识粒度类型对应的第一知识文本,以及所述第二知识粒度类型对应的第二知识文本,上述回复生成模块具体用于:
25、根据所述第一知识文本构建第一背景文本;
26、将所述第一背景文本和当前轮次的所述历史对话文本对应的所述第二知识文本进行拼接,得到第二背景文本;
27、按照轮次顺序将各个轮次的所述历史对话文本依次进行拼接,得到第三拼接文本;
28、将所述第二背景文本和所述第三拼接文本进行拼接,得到目标拼接文本。
29、进一步,上述获取模块具体用于:
30、将所述第一知识粒度类型的各个所述候选文本分别输入预训练的自然语言处理模型进行编码处理,得到各个所述候选文本的候选向量;
31、将至少两个轮次的所述历史对话文本输入所述自然语言处理模型进行编码处理,得到查询向量;
32、分别计算所述查询向量和各个所述候选向量之间的相似度,根据所述相似度从各个所述候选文本中筛选出目标文本。
33、进一步,上述获取模块具体用于:
34、在多个轮次的所述历史对话文本中提取出当前轮次之前所有轮次的所述历史对话文本,作为查询文本;
35、或者,将在多个轮次的所述历史对话文本中提取出单个轮次的所述历史对话文本,作为查询文本。
36、进一步,上述提示构建模块具体用于:
37、确定所述目标文本的知识粒度类型的类型名称;
38、将所述目标文本、所述类型名称、预设的连接符号和所述目标文本对应的所述参考知识文本依次进行拼接,得到第一提示文本。
39、进一步,上述提示构建模块具体用于:
40、确定所述目标文本的知识粒度类型的类型名称;
41、将所述历史对话文本、所述类型名称和预设的连接符号依次进行拼接,得到第二提示文本。
42、进一步,上述知识生成模块具体用于:
43、获取知识生成指令,所述知识生成指令用于提示生成所述历史对话文本的预测知识文本;
44、将所述知识生成指令、所述第一提示文本和所述第二提示文本拼接后输入大语言模型进行文本预测,生成所述预测知识文本。
45、进一步,上述回复生成模块具体用于:
46、获取回复生成指令,所述回复生成指令用于提示生成当前轮次的响应文本;
47、将所述回复生成指令和所述目标拼接文本拼接后输入所述大语言模型进行文本预测,生成所述响应文本。
48、另一方面,本申请实施例还提供了一种电子设备,包本文档来自技高网...
【技术保护点】
1.一种文本生成方法,其特征在于,包括:
2.根据权利要求1所述的文本生成方法,其特征在于,所述候选文本的知识粒度类型的数量为至少一种,所述在多个所述候选文本中筛选出与所述历史对话文本相似的目标文本,包括:
3.根据权利要求2所述的文本生成方法,其特征在于,所述参考知识文本的知识粒度类型包括第一知识粒度类型和第二知识粒度类型,所述第一知识粒度类型的粒度范围大于所述第二知识粒度类型的粒度范围,所述在所述知识粒度类型与所述查询文本对应的所述候选文本中,筛选出与所述查询文本相似的目标文本,包括:
4.根据权利要求3所述的文本生成方法,其特征在于,所述预测知识文本包括所述第一知识粒度类型对应的第一知识文本,以及所述第二知识粒度类型对应的第二知识文本,所述将多个轮次的历史对话文本与所述预测知识文本进行拼接,得到目标拼接文本,包括:
5.根据权利要求3所述的文本生成方法,其特征在于,所述预测知识文本包括所述第一知识粒度类型对应的第一知识文本,以及所述第二知识粒度类型对应的第二知识文本,所述将多个轮次的历史对话文本与所述预测知识文本进行拼接,得到
6.根据权利要求3所述的文本生成方法,其特征在于,所述在所述第一知识粒度类型的所述候选文本中,筛选出与至少两个轮次的所述历史对话文本相似的目标文本,包括:
7.根据权利要求2至6任意一项所述的文本生成方法,其特征在于,所述在多个轮次的所述历史对话文本中提取出查询文本,包括:
8.根据权利要求1所述的文本生成方法,其特征在于,所述根据所述目标文本和对应的所述参考知识文本构建第一提示文本,包括:
9.根据权利要求1所述的文本生成方法,其特征在于,所述根据所述历史对话文本构建第二提示文本,包括:
10.根据权利要求1所述的文本生成方法,其特征在于,所述将所述第一提示文本和所述第二提示文本拼接后输入大语言模型进行文本预测,生成所述预测知识文本,包括:
11.根据权利要求1所述的文本生成方法,其特征在于,所述将所述目标拼接文本输入所述大语言模型进行文本预测,生成当前轮次的响应文本,包括:
12.一种文本生成装置,其特征在于,包括:
13.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11任意一项所述的文本生成方法。
14.一种计算机可读存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11任意一项所述的文本生成方法。
15.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11任意一项所述的文本生成方法。
...【技术特征摘要】
1.一种文本生成方法,其特征在于,包括:
2.根据权利要求1所述的文本生成方法,其特征在于,所述候选文本的知识粒度类型的数量为至少一种,所述在多个所述候选文本中筛选出与所述历史对话文本相似的目标文本,包括:
3.根据权利要求2所述的文本生成方法,其特征在于,所述参考知识文本的知识粒度类型包括第一知识粒度类型和第二知识粒度类型,所述第一知识粒度类型的粒度范围大于所述第二知识粒度类型的粒度范围,所述在所述知识粒度类型与所述查询文本对应的所述候选文本中,筛选出与所述查询文本相似的目标文本,包括:
4.根据权利要求3所述的文本生成方法,其特征在于,所述预测知识文本包括所述第一知识粒度类型对应的第一知识文本,以及所述第二知识粒度类型对应的第二知识文本,所述将多个轮次的历史对话文本与所述预测知识文本进行拼接,得到目标拼接文本,包括:
5.根据权利要求3所述的文本生成方法,其特征在于,所述预测知识文本包括所述第一知识粒度类型对应的第一知识文本,以及所述第二知识粒度类型对应的第二知识文本,所述将多个轮次的历史对话文本与所述预测知识文本进行拼接,得到目标拼接文本,包括:
6.根据权利要求3所述的文本生成方法,其特征在于,所述在所述第一知识粒度类型的所述候选文本中,筛选出与至少两个轮次的所述历史对话文本相似的目标文本,包括:
7.根据权...
【专利技术属性】
技术研发人员:倪宣凡,李丕绩,蔡登,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。