System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据生成方法、电子设备及存储介质技术_技高网

数据生成方法、电子设备及存储介质技术

技术编号:40415800 阅读:7 留言:0更新日期:2024-02-20 22:32
本申请公开了一种数据生成方法、电子设备及存储介质,涉及数据处理技术、文本生成技术、大模型技术领域。其中,该方法包括:获取用户数据;利用数据生成模型处理用户数据,生成用户数据对应的反馈数据,其中,用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的,不同智能体用于生成训练对话数据中不同对话角色的发言数据;输出反馈数据。本申请解决了相关技术中用于训练模型的训练对话数据多样性较差,导致训练出的模型泛化性较低的技术问题。

【技术实现步骤摘要】

本申请涉及数据处理技术、文本生成技术、大模型,具体而言,涉及一种数据生成方法、电子设备及存储介质


技术介绍

1、大语言模型可以利用外部知识和外部工具,解答用户问题或实现用户需求,在智能客服、智能助手、企业模型等多种场景存在广泛的应用需求。大语言模型通常是利用预先构建好的训练对话数据进行训练得到的,但是,目前训练对话数据往往是整体构建的,难以实现较好的多样性,导致大语言模型的泛化性较低,无法应用于多种应用场景。

2、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请实施例提供了一种数据生成方法、电子设备及存储介质,以至少解决相关技术中用于训练模型的训练对话数据多样性较差,导致训练出的模型泛化性较低的技术问题。

2、根据本申请实施例的一个方面,提供了一种数据生成方法,包括:获取用户数据;利用数据生成模型处理用户数据,生成用户数据对应的反馈数据,其中,用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的,不同智能体用于生成训练对话数据中不同对话角色的发言数据;输出反馈数据。

3、根据本申请实施例的另一方面,还提供了一种数据生成方法,包括:构建多个智能体,其中,不同智能体用于生成不同对话角色的发言数据;通过多个智能体进行交互,生成训练对话数据,其中,训练对话数据用于对数据生成模型进行训练,数据生成模型用于生成用户数据对应的反馈数据。

4、根据本申请实施例的另一方面,还提供了一种数据生成方法,包括:响应作用于操作界面上的输入指令,在操作界面上显示用户数据;响应作用于操作界面上的反馈指令,在操作界面上显示用户数据对应的反馈数据,其中,反馈数据是利用数据生成模型处理用户数据所生成的数据,用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的,不同智能体用于生成训练对话数据中不同对话角色的发言数据。

5、根据本申请实施例的另一方面,还提供了一种数据生成方法,包括:通过调用第一接口获取用户数据,其中,第一接口包括第一参数,第一参数的参数值包括用户数据;利用数据生成模型处理用户数据,生成用户数据对应的反馈数据,其中,用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的,不同智能体用于生成训练对话数据中不同对话角色的发言数据;通过调用第二接口输出反馈数据,其中,第二接口包括第二参数,第二参数的参数值包括反馈数据。

6、根据本申请实施例的另一方面,还提供了一种数据生成装置,包括:获取模块,用于获取用户数据;生成模块,用于利用数据生成模型处理用户数据,生成用户数据对应的反馈数据,其中,用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的,不同智能体用于生成训练对话数据中不同对话角色的发言数据;输出模块,用于输出反馈数据。

7、根据本申请实施例的另一方面,还提供了一种数据生成装置,包括:构建模块,用于构建多个智能体,其中,不同智能体用于生成不同对话角色的发言数据;生成模块,用于通过多个智能体进行交互,生成训练对话数据,其中,训练对话数据用于对数据生成模型进行训练,数据生成模型用于生成用户数据对应的反馈数据。

8、根据本申请实施例的另一方面,还提供了一种数据生成装置,包括:第一显示模块,用于响应作用于操作界面上的输入指令,在操作界面上显示用户数据;第二显示模块,用于响应作用于操作界面上的反馈指令,在操作界面上显示用户数据对应的反馈数据,其中,反馈数据是利用数据生成模型处理用户数据所生成的数据,用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的,不同智能体用于生成训练对话数据中不同对话角色的发言数据。

9、根据本申请实施例的另一方面,还提供了一种数据生成装置,包括:获取模块,用于通过调用第一接口获取用户数据,其中,第一接口包括第一参数,第一参数的参数值包括用户数据;生成模块,用于利用数据生成模型处理用户数据,生成用户数据对应的反馈数据,其中,用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的,不同智能体用于生成训练对话数据中不同对话角色的发言数据;输出模块,用于通过调用第二接口输出反馈数据,其中,第二接口包括第二参数,第二参数的参数值包括反馈数据。

10、根据本申请实施例的另一方面,还提供了一种电子设备,包括:存储器,存储有可执行程序;处理器,用于运行程序,其中,程序运行时执行上述任意一项的方法。

11、根据本申请实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的可执行程序,其中,在可执行程序运行时控制计算机可读存储介质所在设备执行上述任意一项的方法。

12、在本申请实施例中,采用获取用户数据;利用数据生成模型处理用户数据,生成用户数据对应的反馈数据,其中,用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的,不同智能体用于生成训练对话数据中不同对话角色的发言数据;输出反馈数据的方式。容易注意到的是,通过多个智能体的交互构建,能够构建更加真实、多样的训练对话数据,基于更加真实、多样的对话数据对模型进行训练,达到了增强模型的泛化性的目的,从而实现了对模型训练时,可以使训练后的模型泛化性较强的技术效果,进而解决了相关技术中用于训练模型的训练对话数据多样性较差,导致训练出的模型泛化性较低的技术问题。

13、容易注意到的是,上面的通用描述和后面的详细描述仅仅是为了对本申请进行举例和解释,并不构成对本申请的限定。

本文档来自技高网...

【技术保护点】

1.一种数据生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述多个智能体包含用户角色智能体、助理角色智能体和工具角色智能体,所述用户角色智能体用于生成用户角色的发言数据,所述助理角色智能体用于生成助理角色的发言数据,或生成用于调用所述工具角色智能体的请求参数,所述工具角色智能体用于基于所述请求参数生成工具角色的发言数据。

4.根据权利要求3所述的方法,其特征在于,在所述第二智能体为所述用户角色智能体的情况下,利用所述多个智能体中的第二智能体基于所述历史轮次发言数据,生成当前轮次发言数据,包括:

5.根据权利要求4所述的方法,其特征在于,基于知识库数据和工具库数据,生成场景描述信息,包括:

6.根据权利要求4所述的方法,其特征在于,基于所述知识库数据、所述工具库数据和所述场景描述信息,生成所述用户角色的画像信息,包括:

7.根据权利要求4所述的方法,其特征在于,利用所述用户角色智能体基于所述场景描述信息、所述画像信息和所述历史轮次发言数据,生成所述当前轮次发言数据,包括:

8.根据权利要求3所述的方法,其特征在于,在所述第二智能体为所述助理角色智能体和所述工具角色智能体的情况下,利用所述多个智能体中的第二智能体基于所述历史轮次发言数据,生成当前轮次发言数据,包括:

9.根据权利要求8所述的方法,其特征在于,利用所述助理角色智能体基于所述历史轮次发言数据,生成目标发言数据,包括:

10.根据权利要求8所述的方法,其特征在于,利用所述工具角色智能体基于所述请求参数,生成所述当前轮次发言数据,包括:

11.根据权利要求2所述的方法,其特征在于,所述方法还包括:

12.根据权利要求11所述的方法,其特征在于,基于所述反馈结果对生成所述当前轮次发言数据的目标智能体进行调整,包括如下至少之一:

13.一种数据生成方法,其特征在于,包括:

14.根据权利要求13所述的方法,其特征在于,通过所述多个智能体进行交互,生成训练对话数据,包括:

15.一种数据生成方法,其特征在于,包括:

16.一种数据生成方法,其特征在于,包括:

17.一种电子设备,其特征在于,包括:

18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的可执行程序,其中,在所述可执行程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至16中任意一项所述的方法。

...

【技术特征摘要】

1.一种数据生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述多个智能体包含用户角色智能体、助理角色智能体和工具角色智能体,所述用户角色智能体用于生成用户角色的发言数据,所述助理角色智能体用于生成助理角色的发言数据,或生成用于调用所述工具角色智能体的请求参数,所述工具角色智能体用于基于所述请求参数生成工具角色的发言数据。

4.根据权利要求3所述的方法,其特征在于,在所述第二智能体为所述用户角色智能体的情况下,利用所述多个智能体中的第二智能体基于所述历史轮次发言数据,生成当前轮次发言数据,包括:

5.根据权利要求4所述的方法,其特征在于,基于知识库数据和工具库数据,生成场景描述信息,包括:

6.根据权利要求4所述的方法,其特征在于,基于所述知识库数据、所述工具库数据和所述场景描述信息,生成所述用户角色的画像信息,包括:

7.根据权利要求4所述的方法,其特征在于,利用所述用户角色智能体基于所述场景描述信息、所述画像信息和所述历史轮次发言数据,生成所述当前轮次发言数据,包括:

8.根据权利要求3所述的方法,其特征在于,在所述第二智能体为所述助理角色智能...

【专利技术属性】
技术研发人员:王睿黎航宇武玉川黄非李永彬
申请(专利权)人:阿里云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1