使用由通用模型生成的训练数据的特定任务机器学习操作制造技术

技术编号：39280107 阅读：16 留言：0更新日期：2023-11-07 10:54

本申请涉及使用由通用模型生成的训练数据的特定任务机器学习操作。系统和方法提供了通过使用来自不同机器学习模型的查询/响应对作为训练数据来开发和部署机器学习模型的流水线。建立一组模型参数，并且经训练的机器学习模型提供对输入查询的响应，以开发查询/响应对。这些查询/响应对可用于训练不同的机器学习模型。该模型可以针对原始模型进行测试以确定它们是否一致，并且当模型一致时，可以将不同的机器学习模型部署为系统的主要模型。不同的机器学习模型部署为系统的主要模型。不同的机器学习模型部署为系统的主要模型。

全部详细技术资料下载

【技术实现步骤摘要】
使用由通用模型生成的训练数据的特定任务机器学习操作

技术介绍

[0001]各种系统可以部署机器学习模型以与输入查询交互。通常，这些模型在针对特定任务或领域的大型数据集或人工注释的数据集上进行训练。获得足够大的数据集或人工注释的数据集可能既耗时又昂贵，这可能会延迟模型的部署。此外，使用针对特定应用的通用模型可能会导致较差的结果，当预期的用户查询特定于模型可能无法充分训练的特定领域时，这种情况可能会加剧。
附图说明
[0002]将参照附图描述根据本公开的各种实施例，其中：
[0003]图1示出了根据至少一个实施例的示例自然语言处理环境；
[0004]图2示出了根据至少一个实施例的机器学习平台的示例；
[0005]图3示出了根据至少一个实施例的机器学习平台训练阶段的示例；
[0006]图4示出了根据至少一个实施例的机器学习平台查证阶段的示例；
[0007]图5示出了根据至少一个实施例的机器学习平台生产阶段的示例；
[0008]图6A示出了根据至少一个实施例的用于生成训练数据的过程的示例流程图；
[0009]图6B示出了根据至少一个实施例的用于查证机器学习模型的过程的示例流程图；
[0010]图7示出了根据至少一个实施例的示例数据中心系统；
[0011]图8示出了根据至少一个实施例的计算机系统；
[0012]图9示出了根据至少一个实施例的计算机系统；
[0013]图10示出了根据一个或更多个实施例的图形处理器的至少部分；以及
[0014]图...

【技术保护点】

【技术特征摘要】
1.一种系统，包括：一个或更多个处理器，用于：接收与第一模型相关联的一个或更多个参数，所述一个或更多个参数包括一个或更多个类；接收针对所述第一模型的一个或更多个第一查询，所述第一模型被训练以对与所述一个或更多个类相关联的查询进行响应；使用所述一个或更多个第一查询和来自所述第一模型的相应响应来训练第二模型；以及接收对经训练的第二模型的一个或更多个第二查询，所述经训练的第二模型对与所述一个或更多个类相关联的所述一个或更多个第二查询进行响应；以及使用数据存储来存储所述查询和相应的响应。2.如权利要求1所述的系统，其中所述第一模型是零样本模型。3.如权利要求1所述的系统，其中所述一个或更多个参数至少部分地包括所述一个或更多个类的自然语言描述。4.如权利要求1所述的系统，其中所述第二模型至少部分地与所述第一模型并行操作。5.如权利要求1所述的系统，其中所述一个或更多个处理器进一步用于：确定所述第一模型的响应和所述第二模型的响应之间的一致性；以及确定所述一致性超过阈值。6.如权利要求5所述的系统，其中在达到所述阈值之后所述第一模型停止接收所述一个或更多个第一查询。7.如权利要求1所述的系统，其中所述一个或更多个处理器进一步用于：确定所述数据存储中的查询和相应响应的数量超过训练阈值。8.如权利要求1所述的系统，其中所述第二模型至少部分地与所述第一模型的操作并行地被训练。9.如权利要求1所述的系统，其中所述相应响应包括对应于所述一个或更多个类的相应标签。10.一种方法，包括：接收第一机器学习模型的类参数；接收查询；根据所述类参数，使用所述第一机器学习模型处理所述查询；提供对所述查询的响应；将所述查询和所述响应存储为查询/响应对；以及向第二机器学习模型提供所述查询/响应对作为训练数据。11.如权利要求10所述的方法，其中所述类参数至少包括分类器的一个或更多个类的自然语言描述。12.如权利要求10所述的方法，还包括：接收第二查询；使用所述第一机器学习模型和所述第二机器学习模型二者处理所述第二查询；将来自...

【专利技术属性】
技术研发人员：R，
申请(专利权)人：辉达公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人