数据生成方法、电子设备及存储介质技术

技术编号：40415800 阅读：28 留言：0更新日期：2024-02-20 22:32

本申请公开了一种数据生成方法、电子设备及存储介质，涉及数据处理技术、文本生成技术、大模型技术领域。其中，该方法包括：获取用户数据；利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据；输出反馈数据。本申请解决了相关技术中用于训练模型的训练对话数据多样性较差，导致训练出的模型泛化性较低的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据处理技术、文本生成技术、大模型，具体而言，涉及一种数据生成方法、电子设备及存储介质。

技术介绍

1、大语言模型可以利用外部知识和外部工具，解答用户问题或实现用户需求，在智能客服、智能助手、企业模型等多种场景存在广泛的应用需求。大语言模型通常是利用预先构建好的训练对话数据进行训练得到的，但是，目前训练对话数据往往是整体构建的，难以实现较好的多样性，导致大语言模型的泛化性较低，无法应用于多种应用场景。

2、针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

1、本申请实施例提供了一种数据生成方法、电子设备及存储介质，以至少解决相关技术中用于训练模型的训练对话数据多样性较差，导致训练出的模型泛化性较低的技术问题。

2、根据本申请实施例的一个方面，提供了一种数据生成方法，包括：获取用户数据；利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中...

【技术保护点】

1.一种数据生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述多个智能体包含用户角色智能体、助理角色智能体和工具角色智能体，所述用户角色智能体用于生成用户角色的发言数据，所述助理角色智能体用于生成助理角色的发言数据，或生成用于调用所述工具角色智能体的请求参数，所述工具角色智能体用于基于所述请求参数生成工具角色的发言数据。

4.根据权利要求3所述的方法，其特征在于，在所述第二智能体为所述用户角色智能体的情况下，利用所述多个智能体中的第二智能体基于所述历史轮次发言数据，生...

【技术特征摘要】

1.一种数据生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，在所述第二智能体为所述用户角色智能体的情况下，利用所述多个智能体中的第二智能体基于所述历史轮次发言数据，生成当前轮次发言数据，包括：

5.根据权利要求4所述的方法，其特征在于，基于知识库数据和工具库数据，生成场景描述信息，包括：

6.根据权利要求4所述的方法，其特征在于，基于所述知识库数据、所述工具库数据和所述场景描述信息，生成所述用户角色的画像信息，包括：

7.根据权利要求4所述的方法，其特征在于，利用所述用户角色智能体基于所述场景描述信息、所述画像信息和所述历史轮次发言数据，生成所述当前轮次发言数据，包括：

8.根据权利要求3所述的方法，其特征在于，在所述第二智能体为所述助理角色智能...

【专利技术属性】
技术研发人员：王睿，黎航宇，武玉川，黄非，李永彬，
申请(专利权)人：阿里云计算有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人