System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于大模型提供数据的方法和服务器技术_技高网

基于大模型提供数据的方法和服务器技术

技术编号:40875217 阅读:2 留言:0更新日期:2024-04-08 16:44
一种基于大模型提供数据的方法和服务器,所述大模型设置有采样参数top_k、temperature和n的值,所述方法包括:获取用户输入的第一提示,所述提示用于提示生成特定类型的数据;对于待生成的n个构造程序中的每个构造程序,大模型根据Prompt和大模型生成的该构造程序中的前i‑1个词汇,确定词库中包括的多个所述第一词汇各自的概率,其中,i>0,选取概率排序在前k个以内的k个第二词汇,根据temperature的值从所述k个第二词汇中选择一个词汇作为该构造程序的第i个词汇;根据temperature的值从所述k个第一词汇串中选择n个第二词汇串;基于所述n个构造程序向用户提供数据。

【技术实现步骤摘要】

本说明书实施例属于计算机,尤其涉及一种基于大模型提供数据的方法和服务器


技术介绍

1、数字类业务的测试往往依托于各种类型的数据集,而这些数据的构造目前基本上依赖于由测试人员进行构造。当前已发布了多种生成式的大模型,对于已有的开源的大模型,如果在提示(prompt)中提示直接生成例如符合特定格式的数据,例如“帮我生成一个表格,要求表头符合以下条件:****,数据行符合以下条件:****。”,大模型可能直接回复“无法生成表格”,或者生成的表格不符合要求;如果利用大模型生成用于构造数据的构造程序,大模型有可能生成不能正常运行的代码。


技术实现思路

1、本专利技术的目的在于提供一种基于大模型提供数据的方法,通过设置大模型的参数,使得大模型并行输出多个构造程序,从而可以以较快的响应时间向用户返回数据。

2、本说明书第一方面提供一种基于大模型提供数据的方法,所述大模型设置有采样参数k、temperature和n的值,所述方法包括:获取用户输入的第一提示,所述提示用于提示生成特定类型的数据;对于待生成的n个构造程序中的每个构造程序,所述大模型根据所述第一提示和所述大模型生成的该构造程序中的前i-1个词汇,确定词库中包括的多个所述第一词汇各自的概率,其中,i>0,选取概率排序在前k个以内的k个第二词汇,根据temperature的值从所述k个第二词汇中选择一个词汇作为该构造程序的第i个词汇;基于所述n个构造程序向用户提供数据。

3、在一种实施方式中,所述通过所述n个构造程序提供数据包括:运行所述n个构造程序,在所述n个构造程序中的至少m个构造程序运行成功的情况下,获得至少m个数据,向用户显示所述至少m个数据。

4、在一种实施方式中,所述方法还包括:在所述n个构造程序都运行失败的情况中,减小k或temperature的值,或者同时减小k和temperature的值,基于更新后的采样参数重新生成n个构造程序。

5、在一种实施方式中,所述方法还包括:所述大模型基于所述第一提示生成第二提示,所述第二提示的结尾包括用于指示程序语句开始的词汇,所述大模型基于所述第一提示生成n个构造程序中的前i个词汇包括:所述大模型基于所述第二提示生成n个构造程序中的前i个词汇。

6、在一种实施方式中,所述方法还包括:将所述大模型的输出的结束词汇预先设置为用于指示程序语句结束的词汇。

7、在一种实施方式中,所述方法还包括:将所述至少m个构造程序发送给用户设备;从用户设备接收更新的p个构造程序,所述p个构造程序基于所述至少m额构造程序中的p个构造程序获得;运行所述p个构造程序,得到q个数据,对用户提供所述q个数据。

8、在一种实施方式中,所述方法还包括:根据用户的指示,存储符合要求的数据;向用户提供数据下载的接口。

9、在一种实施方式中,所述方法还包括:在所述大模型包括的参数数目小于第一预设值的情况下,将k设置为小于第二预设值,将temperature的值设置为小于第三预设值;在所述大模型包括的参数数目大于第一预设值的情况下,将k设置为大于第二预设值,将temperature的值设置为大于第三预设值。

10、在一种实施方式中,所述提示用于提示生成构造程序,并用于提示所述构造程序用于生成所述特定类型的数据。

11、本说明书第二方面提供一种基于大模型提供数据的服务器,所述大模型设置有采样参数k、temperature和n的值,所述服务器包括:

12、获取单元,用于获取用户输入的第一提示,所述提示用于提示生成特定类型的数据;

13、生成单元,用于对于待生成的n个构造程序中的每个构造程序,所述大模型根据所述第一提示和所述大模型生成的该构造程序中的前i-1个词汇,确定词库中包括的多个所述第一词汇各自的概率,其中,i>0,选取概率排序在前k个以内的k个第二词汇,根据temperature的值从所述k个第二词汇中选择一个词汇作为该构造程序的第i个词汇;

14、提供单元,用于基于所述n个构造程序向用户提供数据。

15、本说明书第三方面提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面所述的方法。

16、本说明书第四方面提供一种服务器,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面所述的方法。

17、在本说明书实施例提供的方案中,通过结合大模型的k和temperature参数,根据所述提示和大模型生成的n个构造程序中的前i-1个词汇,确定词库中包括的多个词汇在各组前i-1个词汇的前缀下的概率,选取概率排序在前k个以内的k个词汇串,然后根据temperature的值从k个词汇串中选择n个词汇串,从而使得大模型针对一个prompt可快速输出多个较优的候选程序,从而大大提高了输出结果命中率。

本文档来自技高网...

【技术保护点】

1.一种基于大模型提供数据的方法,所述大模型设置有采样参数k、temperature和n的值,所述方法包括:

2.根据权利要求1所述的方法,所述通过所述n个构造程序向用户提供数据包括:

3.根据权利要求2所述的方法,所述方法还包括:

4.根据权利要求1所述的方法,还包括:

5.根据权利要求1所述的方法,还包括:将所述大模型的输出的结束词汇预先设置为用于指示程序语句结束的词汇。

6.根据权利要求2所述的方法,还包括:

7.根据权利要求1所述的方法,还包括:根据用户的指示,存储符合要求的数据;向用户提供数据下载的接口。

8.根据权利要求1所述的方法,还包括:

9.根据权利要求1所述的方法,其中,所述第一提示用于提示生成构造程序,并用于提示所述构造程序用于生成所述特定类型的数据。

10.一种基于大模型提供数据的计算设备,所述大模型设置有采样参数k、temperature和n的值,所述服务器包括:

11.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-9中任一项的所述的方法。

12.一种服务器,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-9中任一项所述的方法。

...

【技术特征摘要】

1.一种基于大模型提供数据的方法,所述大模型设置有采样参数k、temperature和n的值,所述方法包括:

2.根据权利要求1所述的方法,所述通过所述n个构造程序向用户提供数据包括:

3.根据权利要求2所述的方法,所述方法还包括:

4.根据权利要求1所述的方法,还包括:

5.根据权利要求1所述的方法,还包括:将所述大模型的输出的结束词汇预先设置为用于指示程序语句结束的词汇。

6.根据权利要求2所述的方法,还包括:

7.根据权利要求1所述的方法,还包括:根据用户的指示,存储符合要求的数据;向用户提供数据下载的接口。

【专利技术属性】
技术研发人员:张鑫
申请(专利权)人:蚂蚁区块链科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1