在合成数据系统和应用程序中使用域对抗学习的域适应技术方案

技术编号：38754258 阅读：13 留言：0更新日期：2023-09-10 09:39

在各种示例中，可以使用多阶梯度来更新机器学习模型(MLM)，以便训练所述MLM，例如至少一阶梯度和任意数量的高阶梯度。可以训练MLM中的至少第一个以生成对于对应于第一数据集的第一域和对应于第二数据集的第二域是不变的特征表示。可以训练所述MLM中的至少第二个以对表示是对应于所述第一域还是所述第二域进行分类。可以训练所述MLM中的至少第三个以执行任务。所述第一数据集可以对应于标记的源域，而所述第二数据集可以对应于未标记的目标域。所述训练可以包括在表示空间中将知识从所述第一域转移到所述第二域。述第一域转移到所述第二域。述第一域转移到所述第二域。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】在合成数据系统和应用程序中使用域对抗学习的域适应

技术介绍

[0001]无监督域适应(UDA)通过从标记的源域(例如，具有不同分布的相关数据集，其中已经存在大量标记数据)转移知识来解决目标域中缺乏标记数据的问题。域对抗学习(DAL)是UDA的一种形式，它涉及以对抗方式学习输入的域不变表示。DAL可能旨在欺骗在表示空间中运行的分类器，以对数据点属于源域还是目标域进行分类。更正式地说，DAL可以理解为训练以最小化表示空间中源域和目标域之间的差异。
[0002]在训练神经网络时，可以使用优化器来定义如何更改神经网络的参数，诸如权重和学习率，以便根据损失函数减少损失。DAL通常实现基于梯度下降的优化器，其是一种依赖于损失函数的一阶导数的一阶优化算法。在DAL中，学习算法的对抗性可能是由于梯度反转层(GRL)的引入。在反向传播过程中，GRL可以从后续级别获取梯度并更改其符号—例如，将梯度乘以
‑
1—然后再将其传递到前一层。虽然DAL理论上能够实现高性能，但在实践中，DAL可能明显不稳定且难以实现用于训练神经网络。

技术实现思路

[0003]本公开的实施例涉及对竞争神经网络组件具有增强收敛性的优化器。更具体地，本公开涉及用于确定神经网络的参数值，同时避免与基于梯度的优化算法相关联的潜在问题的方法，这些潜在问题可能导致训练中的不稳定或以其他方式限制训练性能。
[0004]与诸如上述那些训练机器学习模型(MLM)的传统方法相比，MLM的参数值可以至少基于对应于一个或更多个成本函数的多阶梯度来更新。例如，可以至...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法，包括：使用一个或更多个神经网络生成一个或更多个输出，所述一个或更多个神经网络包括对应于一个或更多个第一值的一个或更多个参数；使用一个或更多个成本函数并至少基于所述一个或更多个输出，计算第一梯度和比所述第一梯度更高阶的第二梯度；以及使用所述第一梯度和所述第二梯度调整对应于所述一个或更多个参数的所述一个或更多个第一值，以确定与所述一个或更多个神经网络的所述一个或更多个参数相对应的一个或更多个第二值。2.根据权利要求1所述的方法，其中所述一个或更多个神经网络包括第一神经网络和第二神经网络，所述第一神经网络和所述第二神经网络使用对抗性训练来训练。3.根据权利要求1所述的方法，其中所述一个或更多个神经网络包括多个神经网络，并且至少部分地通过以下方式训练所述多个神经网络：训练所述多个神经网络中的至少一个第一神经网络，以生成一个或更多个特征的表示，所述表示对于与输入到所述至少一个第一神经网络的第一数据集相对应的第一域和与输入到所述至少一个第一神经网络的第二数据集相对应的第二域是不变的；以及训练所述多个神经网络中的至少一个第二神经网络以对所述表示是对应于所述第一域还是所述第二域进行分类。4.根据权利要求3所述的方法，其中所述第一域对应于合成数据，而所述第二域对应于真实世界的数据。5.根据权利要求3所述的方法，还包括：使用分配给所述第一数据集的一个或更多个真值标签来训练所述多个神经网络中的至少一个第三神经网络，以对所述表示进行分类。6.根据权利要求1所述的方法，其中调整对应于所述一个或更多个参数的所述一个或更多个第一值是至少基于至少所述第一梯度和所述第二梯度的统计组合。7.根据权利要求1所述的方法，其中所述第一梯度是所述一个或更多个成本函数的一阶梯度，并且所述第二梯度是所述一个或更多个成本函数的二阶梯度。8.根据权利要求1所述的方法，其中所述一个或更多个神经网络包括一个或更多个对抗性神经网络，并且所述训练包括确定所述一个或更多个对抗性神经网络的所述一个或更多个参数收敛到局部纳什均衡。9.根据权利要求1所述的方法，其中所述一个或更多个神经网络包括梯度反转层。10.根据权利要求1所述的方法，还包括使用所述一个或更多个神经网络来执行系统内的一个或更多个操作，所述系统包括或被包括在以下的至少一个中：用于自主或半自主机器的控制系统；用于自主或半自主机器的感知系统；用于执行模拟操作的系统；用于执行数字孪生操作的系统；用于执行光传输模拟的系统；用于执行3D资产的协作内容创建的系统；用于执行深度学习操作的系统；使用边缘设备实现的系统；使用机器人实现的系统；用于执行对话式AI操作的系统；用于生成合成数据的系统；包含一个或更多个虚拟机(VM)的系统；至少部分地在数据中心中实现的系统；或者至少部分地使用云计算资源实现的系统。11.一种系统，包括：一个或更多个处理单元，用于：生成一个或更多个第一神经网络的一个或更多个第一输出和一个或更多个第二神经网络的一个或更多个第二输出；使用一个或更多个成本函数并至少基于所述一个或更多个第一输出和所述一个或更多个第二输出，确定所述一个或更多个第一神经网络和所述一个或更多个第二神经网络的联合参数集的第一梯度和第二梯度，所述第二梯度比所述第一梯度更高阶；以及使用所述第一梯度和所述第二梯度更新所述联合参数集的值。
12.根据权利要求11所述的系统，其中通过...

【专利技术属性】
技术研发人员：D，
申请(专利权)人：辉达公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人