用于训练感知算法的基于梯度方差的主动学习框架制造技术

技术编号:34681849 阅读:12 留言:0更新日期:2022-08-27 16:12
本公开提供了“用于训练感知算法的基于梯度方差的主动学习框架”。神经网络和学习算法可使用梯度的方差来提供对模型的启发式理解。梯度的方差可在主动学习技术中用于训练神经网络。技术包括接收具有矢量的数据集。可对数据集进行注释并且可计算损失。损失值可用于通过反向传播来更新神经网络。更新的数据集可用于计算额外损失。可将损失值添加到梯度池。可从梯度池的矢量计算梯度的方差。梯度的方差可用于更新神经网络。用于更新神经网络。用于更新神经网络。

【技术实现步骤摘要】
用于训练感知算法的基于梯度方差的主动学习框架


[0001]本公开总体上涉及神经网络和学习算法。

技术介绍

[0002]神经网络可通过查询信息源(诸如用户或oracle)以用期望的输出注释和标记数据点来通过监督过程进行迭代学习。该学习过程被称为主动学习,并且是增量迭代过程,通过该过程,神经网络可更新其模型以获得新信息。
[0003]学习算法利用oracle的输入来学习和更新。然而,在存在大量数据的场景中,注释和标记未标记的数据集变得非常耗时且昂贵。举例来说,对于用于视觉和对象辨识的神经网络,接收到的数据量可证明对对象的每个未知实例进行注释是昂贵的。
[0004]神经网络可采用多种方法来查询来自oracle的输入。不确定性采样、委员会查询或方差缩减是当前使用的方法,但是在确定哪些数据集需要注释时,神经网络可能会取决于其初始训练数据而引入隐性偏差。
[0005]在标记和注释数据集时,oracle必须评估数据集的不同启动和权重,以针对给定输入给出正确的输出。在改进神经网络时,oracle必须评估影响数据集权重、启动和性能的输入。此外,对反向传播的数据进行注释和标记的效果可能致使神经网络在非意图或非预期方向上发生非预期移位。
[0006]本领域需要一种改进的主动学习训练方法。

技术实现思路

[0007]在实现主动学习以迭代地提高其准确性的神经网络中,利用来自接收到的数据集的梯度变化可减少对oracle筛选未标记数据和注释大量输入的需要。训练方法可采用来自用于训练神经网络的标记数据集的未标记数据的变化。找到跨数据集的多个矢量的变化为神经网络提供了缩小和识别较小数据集的启发式方法,oracle可通过该方法进行注释或查看。
[0008]在一些实施例中,描述了一种用于使用主动学习来训练模型的系统,所述系统具有传感器、一个或多个处理器和系统存储器。所述系统存储器可存储致使所述一个或多个处理器进行以下操作的指令:接收数据集;对所述数据集中的对象进行分类;计算多个损失值;生成所述多个损失值中的每个的梯度;将对应梯度添加到梯度池;计算所述梯度池的方差;并且部分地基于所述梯度池的方差请求对所述数据集的至少一部分进行注释。
[0009]在一些实施例中,描述了使用主动学习来训练模型的方法,所述方法具有以下步骤:接收数据集;基于机器学习模型对所述数据集中的对象进行分类;计算多个损失值;生成所述多个损失值中的每个的梯度;将多个损失值中的每个的对应梯度添加到梯度池;计算所述梯度池的方差;并且部分地基于所述梯度池的方差请求对所述数据集的至少一部分进行注释。在计算多个损失值时,损失值中的每个可表征数据集中的对象的分类与该对象的多个潜在分类中的一个之间的差异。
[0010]在一些实施例中,描述了具有指令的非暂时性计算机可读介质,所述指令在由一个或多个处理器执行时致使一个或多个处理器:接收数据集;基于机器学习模型对所述数据集中的对象进行分类;计算多个损失值;生成所述多个损失值中的每个的梯度;将对应梯度添加到梯度池;计算所述梯度池的方差;并且部分地基于所述梯度池的方差请求对所述数据集进行注释。在计算多个损失值时,损失值中的每个可表征数据集中的对象的分类与该对象的多个潜在分类中的一个之间的差异。
[0011]用于使用主动学习来训练模型的系统和方法的实现方式可包括以下各项中的一者或任一者。在一些实施例中,传感器可包括视觉传感器。在一些实施例中,数据集可包括由传感器接收的数据和/或可视对象数据。在一些实施例中,对数据集中的对象进行分类可包括生成具有对象的多个潜在分类中的每个的值的实际分类矢量。在一些实施例中,计算多个损失值可包括生成假设分类矢量,其中每个损失表征实际分类与假设分类之间的差值。在一些实施例中,生成所述多个损失值中的每个的梯度包括:选择损失值;通过所述机器学习模型反向传播所述损失值以生成所选择的损失值的梯度;以及重复所述步骤直到生成了损失值中的每个的梯度。在一些实施例中,请求注释可包括将方差与阈值进行比较,以及当方差超过阈值时请求注释。在一些实施例中,请求注释的数据集的部分包括数据帧和围绕数据帧的缓冲数据。
附图说明
[0012]可通过参考以下附图来实现对各种实施例的性质和优点的进一步理解。在附图中,相似的部件或特征可具有相同的附图标记。此外,可通过在附图标记后面加上短划线和在相似部件之间进行区分的第二标签来区分相同类型的各种部件。如果在说明书中仅使用第一附图标记,则所述描述适用于具有同一第一附图标记的相似部件中的任何一个,而不考虑第二附图标记。
[0013]图1是根据实施例的用于使用主动学习来训练模型的智能系统的图示。
[0014]图2是根据实施例的用于使用主动学习来训练模型的流程图。
[0015]图3是根据实施例的使用主动学习来训练模型的方法的流程图。
[0016]图4示出了根据实施例的车辆系统的框图。
[0017]图5示出了根据实施例的计算系统的框图。
[0018]图6示出了根据实施例的云计算系统。
具体实施方式
[0019]神经网络中的主动学习可查询oracle以标记未标记的数据集,从而通过迭代训练提供更准确的模型。未标记的数据集可能来自例如对象检测模型中的视觉系统。总体描述了用于使用所确定的梯度方差来训练模型以给出对模型的启发式理解并进一步降低计算费用以及oracle或信息源需要手动标记的数据量的系统和方法。
[0020]作为示例,神经网络可利用感知流水线来获取可视数据。感知流水线可实现视觉传感器和对象边界算法以提供数据集,然后对象检测模型可通过所述数据集对数据集内的对象进行分类和检测。感知流水线可在例如车辆中实现,以用于从车辆的周围环境进行对象检测的目的。
[0021]利用感知流水线的车辆可根据下面描述的方法和系统与训练模型通信地交互以更新对象检测模型。对象检测模型可实现训练方法以进一步更新自身,而无需注释计算方面昂贵、繁重和大量的数据。
[0022]图1示出了用于通过主动学习来训练对象辨识的模型的智能系统100。系统100具有感知流水线150和梯度方差单元110。感知流水线150可用于接收可视数据。梯度方差单元110可用于从由感知流水线150生成的数据集生成不同梯度的方差。感知流水线150可与梯度方差单元110进行电子通信。
[0023]感知流水线150具有传感器152、处理器154、收发器156和存储器160。在一些实施例中,感知流水线150可属于车辆。处理器154可以是计算机处理单元、图形处理单元或用于执行存储在感知流水线存储器160内的指令或模块的任何合适的处理器。收发器156可以是能够接收和传输信号的单元。例如,感知流水线150可通过收发器156与梯度方差单元110进行电子通信。
[0024]传感器152可以是视觉传感器、压力传感器、声纳传感器或用于获取数据的任何合适的传感器。在一些实施例中,传感器152可位于车辆的外部。
[0025]存储器160可具有对象检测模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于使用主动学习来训练模型的系统,所述系统包括:传感器;一个或多个处理器;系统存储器,所述系统存储器存储致使所述一个或多个处理器进行以下操作的指令:接收数据集,所述数据集包括多个数据帧;基于机器学习模型对所述数据集中的对象进行分类;计算多个损失值,所述损失值中的每个表征所述数据集中的所述对象的所述分类与所述对象的多个潜在分类中的一个之间的差异;生成所述多个损失值中的每个的梯度;将对应的梯度添加到梯度池;计算所述梯度池的方差;并且部分地基于所述梯度池的所述方差请求对所述数据集的至少一部分进行注释。2.如权利要求1所述的系统,其中所述传感器包括视觉传感器。3.如权利要求1所述的系统,其中基于所述机器学习模型对所述数据集中的所述对象进行分类包括生成实际分类矢量,所述实际分类矢量包括所述对象的所述多个潜在分类中的每个的值。4.如权利要求3所述的系统,其中计算所述多个损失值包括:针对所述对象的所述多个潜在分类中的每个生成假设分类矢量,并且其中所述损失值中的每个表征所述实际分类矢量与所述假设分类矢量中的一个之间的差值。5.如权利要求1所述的系统,其中生成所述多个损失值中的每个的所述梯度包括:(a)选择损失值;(b)通过所述机器学习模型反向传播所述损失值以生成所选择的损失值的梯度;以及(c)执行步骤(a)和步骤(b)直到生成了所述损失值中的每个的梯度。6.如权利要求1所述的系统,其中部分地基于所述梯度池的所述方差请求对所述数据集的至少所述部分进行注释包括将所述方差与阈值进行比较,并且当所述方差超过所述阈值时请求注释。7.一种用于使用主动学习来训练模型的方法,所述方法包括:接收数据集,所述数据集包括多个数据帧;基于机器学习模型对所述数据集中的对象进行分类;计算多个损失值,所述损失值中的每个表征所述数据集中的所述对象的所述分类与所述对象的多个潜在分类中的一个之间的差异;生成所述多个损失值中的每个的梯度;将所述多个损失值中的每个的对应梯度添加到梯度池;计算所述梯度池的方差;以及部分地基于...

【专利技术属性】
技术研发人员:A
申请(专利权)人:福特全球技术公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1