用于训练感知算法的基于梯度方差的主动学习框架制造技术

技术编号：34681849 阅读：12 留言：0更新日期：2022-08-27 16:12

本公开提供了“用于训练感知算法的基于梯度方差的主动学习框架”。神经网络和学习算法可使用梯度的方差来提供对模型的启发式理解。梯度的方差可在主动学习技术中用于训练神经网络。技术包括接收具有矢量的数据集。可对数据集进行注释并且可计算损失。损失值可用于通过反向传播来更新神经网络。更新的数据集可用于计算额外损失。可将损失值添加到梯度池。可从梯度池的矢量计算梯度的方差。梯度的方差可用于更新神经网络。用于更新神经网络。用于更新神经网络。

全部详细技术资料下载

【技术实现步骤摘要】
用于训练感知算法的基于梯度方差的主动学习框架

[0001]本公开总体上涉及神经网络和学习算法。

技术介绍

[0002]神经网络可通过查询信息源(诸如用户或oracle)以用期望的输出注释和标记数据点来通过监督过程进行迭代学习。该学习过程被称为主动学习，并且是增量迭代过程，通过该过程，神经网络可更新其模型以获得新信息。
[0003]学习算法利用oracle的输入来学习和更新。然而，在存在大量数据的场景中，注释和标记未标记的数据集变得非常耗时且昂贵。举例来说，对于用于视觉和对象辨识的神经网络，接收到的数据量可证明对对象的每个未知实例进行注释是昂贵的。
[0004]神经网络可采用多种方法来查询来自oracle的输入。不确定性采样、委员会查询或方差缩减是当前使用的方法，但是在确定哪些数据集需要注释时，神经网络可能会取决于其初始训练数据而引入隐性偏差。
[0005]在标记和注释数据集时，oracle必须评估数据集的不同启动和权重，以针对给定输入给出正确的输出。在改进神经网络时，oracle必须评估影响数据集权重、启动和性能的输入。此外，对反向传播的数据进行注释和标记的效果可能致使神经网络在非意图或非预期方向上发生非预期移位。
[0006]本领域需要一种改进的主动学习训练方法。

技术实现思路

[0007]在实现主动学习以迭代地提高其准确性的神经网络中，利用来自接收到的数据集的梯度变化可减少对oracle筛选未标记数据和注释大量输入的需要。训练方法可采用来自用于训练神经网络的标记数据...

【技术保护点】

【技术特征摘要】
1.一种用于使用主动学习来训练模型的系统，所述系统包括：传感器；一个或多个处理器；系统存储器，所述系统存储器存储致使所述一个或多个处理器进行以下操作的指令：接收数据集，所述数据集包括多个数据帧；基于机器学习模型对所述数据集中的对象进行分类；计算多个损失值，所述损失值中的每个表征所述数据集中的所述对象的所述分类与所述对象的多个潜在分类中的一个之间的差异；生成所述多个损失值中的每个的梯度；将对应的梯度添加到梯度池；计算所述梯度池的方差；并且部分地基于所述梯度池的所述方差请求对所述数据集的至少一部分进行注释。2.如权利要求1所述的系统，其中所述传感器包括视觉传感器。3.如权利要求1所述的系统，其中基于所述机器学习模型对所述数据集中的所述对象进行分类包括生成实际分类矢量，所述实际分类矢量包括所述对象的所述多个潜在分类中的每个的值。4.如权利要求3所述的系统，其中计算所述多个损失值包括：针对所述对象的所述多个潜在分类中的每个生成假设分类矢量，并且其中所述损失值中的每个表征所述实际分类矢量与所述假设分类矢量中的一个之间的差值。5.如权利要求1所述的系统，其中生成所述多个损失值中的每个的所述梯度包括：(a)选择损失值；(b)通过所述机器学习模型反向传播所述损失值以生成所选择的损失值的梯度；以及(c)执行步骤(a)和步骤(b)直到生成了所述损失值中的每个的梯度。6.如权利要求1所述的系统，其中部分地基于所述梯度池的所述方差请求对所述数据集的至少所述部分进行注释包括将所述方差与阈值进行比较，并且当所述方差超过所述阈值时请求注释。7.一种用于使用主动学习来训练模型的方法，所述方法包括：接收数据集，所述数据集包括多个数据帧；基于机器学习模型对所述数据集中的对象进行分类；计算多个损失值，所述损失值中的每个表征所述数据集中的所述对象的所述分类与所述对象的多个潜在分类中的一个之间的差异；生成所述多个损失值中的每个的梯度；将所述多个损失值中的每个的对应梯度添加到梯度池；计算所述梯度池的方差；以及部分地基于...

【专利技术属性】
技术研发人员：A，
申请(专利权)人：福特全球技术公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人