System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本说明书实施例涉及机器学习,特别涉及提示词生成方法及文本处理方法。
技术介绍
1、随着计算机和互联网技术的发展,大模型在越来越多的场景中得以应用。而大模型针对用户的输入反馈结果时,反馈结果准确度更多的是受提示词的影响。由于不同用户选择的提示词存在较大的差异,导致应用端效果不稳定。而为了能够提高稳定性,通常会针对具体任务设置一个有效的提示词供用户使用。而该提示词的设计需要反复尝试后才能够确定,整个过程耗时耗力。现有技术中,为了能够在应用大模型阶段,使用效果更好的提示词用于结果预测,大多数会采用对提示词具有优化能力的模型进行迭代处理,从而生成快速生成效果更好的提示词供用户使用。但是这一处理过程无法兼容收敛方向和收敛速度,并且需要大量的样本驱动,不仅成本高,且效率低,因此亟需一种有效的方案以解决上述问题。
技术实现思路
1、有鉴于此,本说明书实施例提供了一种提示词生成方法。本说明书一个或者多个实施例同时涉及一种文本处理方法,一种提示词生成装置,一种文本处理装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序产品,以解决现有技术中存在的技术缺陷。
2、根据本说明书实施例的第一方面,提供了一种提示词生成方法,包括:
3、响应于针对目标语言模型提交的提示词生成请求确定样本集,并按照预设的分层采样策略对所述样本集进行分层采样处理,根据分层采样处理结果确定多个代表样本;
4、将所述多个代表样本和所述多个代表样本分别对应的结构化提示信息输入提示词生成模型进
5、在所述多个代表样本分别对应的初始提示词中提取中间提示词,并确定所述中间提示词关联的评估信息;
6、按照所述评估信息优化所述中间提示词,直至获得满足优化停止条件的目标提示词。
7、根据本说明书实施例的第二方面,提供了一种文本处理方法,应用于服务端,包括:
8、接收客户端针对目标语言模型提交的问题文本;
9、根据所述问题文本在所述目标语言模型关联的目标提示词集合中选择待应用提示词,其中,所述目标提示词集合中包含的提示词通过上述方法生成;
10、基于所述待应用提示词对所述问题文本进行更新,并将更新后的问题文本输入至所述目标语言模型进行处理,获得答案文本;
11、将所述答案文本反馈至所述客户端。
12、根据本说明书实施例的第三方面,提供了一种提示词生成装置,包括:
13、确定模块,被配置为响应于针对目标语言模型提交的提示词生成请求确定样本集,并按照预设的分层采样策略对所述样本集进行分层采样处理,根据分层采样处理结果确定多个代表样本;
14、输入模块,被配置为将所述多个代表样本和所述多个代表样本分别对应的结构化提示信息输入提示词生成模型进行处理,获得所述多个代表样本分别对应的初始提示词;
15、提取模块,被配置为在所述多个代表样本分别对应的初始提示词中提取中间提示词,并确定所述中间提示词关联的评估信息;
16、优化模块,被配置为按照所述评估信息优化所述中间提示词,直至获得满足优化停止条件的目标提示词。
17、根据本说明书实施例的第四方面,提供了一种文本处理装置,应用于服务端,包括:
18、接收文本模块,被配置为接收客户端针对目标语言模型提交的问题文本;
19、选择提示词模块,被配置为根据所述问题文本在所述目标语言模型关联的目标提示词集合中选择待应用提示词,其中,所述目标提示词集合中包含的提示词通过上述方法生成;
20、更新文本模块,被配置为基于所述待应用提示词对所述问题文本进行更新,并将更新后的问题文本输入至所述目标语言模型进行处理,获得答案文本;
21、反馈文本模块,被配置为将所述答案文本反馈至所述客户端。
22、根据本说明书实施例的第五方面,提供了一种计算设备,包括:
23、存储器和处理器;
24、所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述提示词生成方法或文本处理方法的步骤。
25、根据本说明书实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述提示词生成方法或文本处理方法的步骤。
26、根据本说明书实施例的第七方面,提供了一种计算机程序产品,包括计算机程序或指令,该计算机程序或指令被处理器执行时实现上述提示词生成方法或文本处理方法的步骤。
27、本实施例提供的提示词生成方法,为了能够快速且精准的得到匹配具体任务的提示词,且保证提示词向正确方向收敛的同时加快收敛速度,可以先响应于针对目标语言模型提交的提示词生成请求确定样本集,为了能够保证后续提示词生成的准确性,可以按照预设的分层采样策略对样本集进行分层采样处理,从而根据分层采样处理结果确定多个代表样本;在此基础上,可以将多个代表样本和多个代表样本分别对应的结构化提示信息输入提示词生成模型进行处理,实现利用提示词生成模型先预测出每个代表样本分别对应的初始提示词;此时得到的初始提示词仅为初始推荐结果,其准确度可能较低,因此可以进一步进行优化。此时可以在多个代表样本分别对应的初始提示词中提取中间提示词,并确定中间提示词关联的评估信息;之后再按照评估信息优化所述中间提示词,即可实现在初始提示词的基础上进行正确收敛方向的收敛,直至获得满足优化停止条件的目标提示词,即可确保目标提示词与具体任务的匹配性,以便于在应用阶段可以使用该提示词向用户反馈更为准确的结果。
本文档来自技高网...【技术保护点】
1.一种提示词生成方法,其特征在于,包括:
2.根据权利要求1所述的提示词生成方法,其特征在于,所述按照预设的分层采样策略对所述样本集进行分层采样处理,根据分层采样处理结果确定多个代表样本,包括:
3.根据权利要求1所述的提示词生成方法,其特征在于,所述多个代表样本中的任意一个代表样本对应的结构化提示信息的确定,包括:
4.根据权利要求1所述的提示词生成方法,其特征在于,所述在所述多个代表样本分别对应的初始提示词中提取中间提示词,包括:
5.根据权利要求4所述的提示词生成方法,其特征在于,所述确定所述中间提示词关联的评估信息,包括:
6.根据权利要求1所述的提示词生成方法,其特征在于,所述按照所述评估信息优化所述中间提示词,直至获得满足优化停止条件的目标提示词,包括:
7.根据权利要求6所述的提示词生成方法,其特征在于,所述将所述提示词预测信息与所述提示词优化信息对应的提示词标准信息进行比对,根据比对结果优化所述中间提示词,直至获得满足优化停止条件的目标提示词,包括:
8.一种文本处理方法,其特征
9.一种计算设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至8任意一项所述方法的步骤。
11.一种计算机程序产品,其特征在于,包括计算机程序或指令,该计算机程序或指令被处理器执行时实现权利要求1至8任意一项所述方法的步骤。
...【技术特征摘要】
1.一种提示词生成方法,其特征在于,包括:
2.根据权利要求1所述的提示词生成方法,其特征在于,所述按照预设的分层采样策略对所述样本集进行分层采样处理,根据分层采样处理结果确定多个代表样本,包括:
3.根据权利要求1所述的提示词生成方法,其特征在于,所述多个代表样本中的任意一个代表样本对应的结构化提示信息的确定,包括:
4.根据权利要求1所述的提示词生成方法,其特征在于,所述在所述多个代表样本分别对应的初始提示词中提取中间提示词,包括:
5.根据权利要求4所述的提示词生成方法,其特征在于,所述确定所述中间提示词关联的评估信息,包括:
6.根据权利要求1所述的提示词生成方法,其特征在于,所述按照所述评估信息优化所述中间提示...
【专利技术属性】
技术研发人员:甄化春,陈佼,王炯亮,陈哲,
申请(专利权)人:恒生电子股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。