当前位置: 首页 > 专利查询>辉达公司专利>正文

使用由通用模型生成的训练数据的特定任务机器学习操作制造技术

技术编号:39280107 阅读:16 留言:0更新日期:2023-11-07 10:54
本申请涉及使用由通用模型生成的训练数据的特定任务机器学习操作。系统和方法提供了通过使用来自不同机器学习模型的查询/响应对作为训练数据来开发和部署机器学习模型的流水线。建立一组模型参数,并且经训练的机器学习模型提供对输入查询的响应,以开发查询/响应对。这些查询/响应对可用于训练不同的机器学习模型。该模型可以针对原始模型进行测试以确定它们是否一致,并且当模型一致时,可以将不同的机器学习模型部署为系统的主要模型。不同的机器学习模型部署为系统的主要模型。不同的机器学习模型部署为系统的主要模型。

【技术实现步骤摘要】
使用由通用模型生成的训练数据的特定任务机器学习操作

技术介绍

[0001]各种系统可以部署机器学习模型以与输入查询交互。通常,这些模型在针对特定任务或领域的大型数据集或人工注释的数据集上进行训练。获得足够大的数据集或人工注释的数据集可能既耗时又昂贵,这可能会延迟模型的部署。此外,使用针对特定应用的通用模型可能会导致较差的结果,当预期的用户查询特定于模型可能无法充分训练的特定领域时,这种情况可能会加剧。
附图说明
[0002]将参照附图描述根据本公开的各种实施例,其中:
[0003]图1示出了根据至少一个实施例的示例自然语言处理环境;
[0004]图2示出了根据至少一个实施例的机器学习平台的示例;
[0005]图3示出了根据至少一个实施例的机器学习平台训练阶段的示例;
[0006]图4示出了根据至少一个实施例的机器学习平台查证阶段的示例;
[0007]图5示出了根据至少一个实施例的机器学习平台生产阶段的示例;
[0008]图6A示出了根据至少一个实施例的用于生成训练数据的过程的示例流程图;
[0009]图6B示出了根据至少一个实施例的用于查证机器学习模型的过程的示例流程图;
[0010]图7示出了根据至少一个实施例的示例数据中心系统;
[0011]图8示出了根据至少一个实施例的计算机系统;
[0012]图9示出了根据至少一个实施例的计算机系统;
[0013]图10示出了根据一个或更多个实施例的图形处理器的至少部分;以及
[0014]图11示出了根据一个或更多个实施例的图形处理器的至少部分。
具体实施方式
[0015]根据各种实施例的方法提供用于自动化模型开发的系统和方法。在至少一个实施例中,用于任务特定模型的训练数据可以由通用模型生成,例如零样本模型(zero

shot model)。例如,可以使用零样本模型部署初始环境,并且可以保存来自零样本模型的响应以及它们相关联的输入查询,以便为任务特定模型生成训练数据。随着时间的推移,可以部署任务特定模型和零样本模型来确定两者之间的收敛,其中收敛的阈值水平可能导致过渡到任务特定模型的排他或半排他使用。以这种方式,通过利用更复杂、计算密集度更高的模型的优势,可以快速开发和部署更轻、计算密集度更低的模型。
[0016]在至少一个实施例中,零样本方法可以与通用模型一起使用,以便接收用户输入并提供响应。零样本方法可用于识别用户意图,例如基于诸如听觉输入的用户输入。各种实施例可以包括一个或更多个受过训练的神经网络模型,其接收诸如听觉用户查询之类的输入,并确定与查询的意图相对应的相关输入的标签。可以至少部分地基于与意图相对应的标签超过阈值的概率来确定标签。在至少一个实施例中,可以提供一组预先确定的标签,然后根据这些标签评估用户输入以确定哪个标签最有可能与输入相关联。
[0017]各种实施例可以克服与部署自然语言处理(NLP)和/或理解(NLU)技术相关联的问题。整理、预处理和标记训练数据以使其成为适合训练模型的形式的过程可能是艰巨的、耗时的和昂贵的。传统NPL模型的引导时间太长(例如,从概念到部署系统的时间)。虽然通用模型(例如零样本模型)可以减少部署时间,但使用非常大的推理例程可能难以获得高质量的结果,与例如以监督方式训练的特定任务模型相比,这可能过于昂贵或计算量太大而无法运行。因此,各种实施例提供允许混合模型开发语言模型的系统和方法,该语言模型可以快速部署而没有需要大的初始数据集或连续操作零样本模型的昂贵的缺点。各种系统确定(例如,基于用户输入)相关域或类,然后使用用于推理请求的通用零样本模型部署与该域对应的模型。然后记录提供给通用模型的请求和随后的答案,并将其用作特定任务模型的真值训练数据。一旦训练完成或达到阈值水平,可以比较来自两个模型的答案以评估一致性水平,如果达到足够的一致性,则可以将查询定向到特定任务的模型,从而实现显著的计算节省。此外,由于任务特定模型的尺寸减小,模型的部署可以扩展到其他或以前不可行的应用或计算环境,例如启用边缘推理等。
[0018]各种实施例可以进一步提供环境仪表板以允许用户输入用于生成新模型的各种规范。例如,用户可以为特定模型选择域,然后提供各种标签或信息以帮助建立通用零样本模型。然而,应当理解,标签也可以由要验证和/或校正的模型产生,以及其他选项。此外,各种实施例可以促进主动学习以提高低置信度标签以供审查,这可以进一步改进模型。在至少一个实施例中,手动校正或额外的推理使用可以触发新的模型训练,例如如果满足一个或更多个阈值。当训练新模型时,可以执行评估(其可能包含手动校正的数据或零样本产生的标签)以确保没有回归,并且可以执行分数校准以确保跨模型版本的置信度分数一致。应当理解,仪表板可以使用户能够通过蒸馏和/或量化来触发模型压缩,这取决于目标用例(例如,在边缘服务器、嵌入式设备等上的部署)。
[0019]环境100可以与一个或更多个NLP/NLU系统一起使用以开发模型,如图1所示。应该理解,环境100可以包括更多或更少的组件,并且环境100的各种组件可以被结合到单个系统中,但是为了方便和清楚起见可以被显示为单独的模块。在该示例中,客户端设备102可以经由一个或更多个网络106向开发环境104发出一个或更多个请求。网络106可以是有线或无线网络,其包括一个或更多个中间系统,例如用户设备、服务器组件、交换机等。
[0020]在该示例中,开发环境104可以与可以为用户提供一个或更多个托管或计算服务以及其他选项的平台相关联。例如,开发环境104可以使用户能够利用一个或更多个机器学习系统,例如对话式人工智能(AI)系统,用于与他们的一个或更多个产品集成使用。开发环境104可以使用户能够为他们期望的目的开发他们自己的模型,以利用现有模型,或者它们的组合。此外,开发环境104还可以提供诸如模型训练、模型查证等服务。应当理解,开发环境104可以集成到更大的服务环境中,该服务环境可以向用户提供各种一次性或基于订阅的服务。此外,开发环境104可以与一个或更多个软件开发工具包(SDK)相关联以构建用于特定平台的应用程序。
[0021]在开发环境104中示出了管理员API 108,其可以接收由客户端设备102提交的一个或更多个请求。管理员API 108可以为客户端设备102提供与之交互的接口,例如以提交对新机器学习系统的请求、编辑或调整现有机器学习系统的属性、运行诊断等。在至少一个实施例中,管理员API 108可以与提供给客户端设备102的服务相关联,该服务与机器学习
系统的托管和/或操作等相关联。
[0022]在至少一个实施例中,机器学习平台110与开发环境104相关联。机器学习平台110可以包括一个或更多个工具以使用户能够建立、训练和/或操作各种机器学习系统以用于各种应用。例如,用户可以利用现有模型,例如已在大型数据集上训练的通用模型,然后微调或以其他方式训练该模型以用于特定任务操作。请求管理器112可以接收请求,例如来本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种系统,包括:一个或更多个处理器,用于:接收与第一模型相关联的一个或更多个参数,所述一个或更多个参数包括一个或更多个类;接收针对所述第一模型的一个或更多个第一查询,所述第一模型被训练以对与所述一个或更多个类相关联的查询进行响应;使用所述一个或更多个第一查询和来自所述第一模型的相应响应来训练第二模型;以及接收对经训练的第二模型的一个或更多个第二查询,所述经训练的第二模型对与所述一个或更多个类相关联的所述一个或更多个第二查询进行响应;以及使用数据存储来存储所述查询和相应的响应。2.如权利要求1所述的系统,其中所述第一模型是零样本模型。3.如权利要求1所述的系统,其中所述一个或更多个参数至少部分地包括所述一个或更多个类的自然语言描述。4.如权利要求1所述的系统,其中所述第二模型至少部分地与所述第一模型并行操作。5.如权利要求1所述的系统,其中所述一个或更多个处理器进一步用于:确定所述第一模型的响应和所述第二模型的响应之间的一致性;以及确定所述一致性超过阈值。6.如权利要求5所述的系统,其中在达到所述阈值之后所述第一模型停止接收所述一个或更多个第一查询。7.如权利要求1所述的系统,其中所述一个或更多个处理器进一步用于:确定所述数据存储中的查询和相应响应的数量超过训练阈值。8.如权利要求1所述的系统,其中所述第二模型至少部分地与所述第一模型的操作并行地被训练。9.如权利要求1所述的系统,其中所述相应响应包括对应于所述一个或更多个类的相应标签。10.一种方法,包括:接收第一机器学习模型的类参数;接收查询;根据所述类参数,使用所述第一机器学习模型处理所述查询;提供对所述查询的响应;将所述查询和所述响应存储为查询/响应对;以及向第二机器学习模型提供所述查询/响应对作为训练数据。11.如权利要求10所述的方法,其中所述类参数至少包括分类器的一个或更多个类的自然语言描述。12.如权利要求10所述的方法,还包括:接收第二查询;使用所述第一机器学习模型和所述第二机器学习模型二者处理所述第二查询;将来自...

【专利技术属性】
技术研发人员:R
申请(专利权)人:辉达公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1