使用自举潜在表示的自监督表示学习制造技术

技术编号：35809987 阅读：22 留言：0更新日期：2022-12-03 13:29

一种计算机实现的训练神经网络的方法。该方法包括：利用目标神经网络处理训练数据项(例如图像)的第一变换视图以生成目标输出，利用在线神经网络处理训练数据项(例如图像)的第二变换视图以生成目标输出的预测，更新在线神经网络的参数以最小化目标输出的预测和目标输出之间的误差，以及基于在线神经网络的参数更新目标神经网络的参数。该方法可以有效地训练编码器神经网络，而不使用带标签的训练数据项，并且不使用对比损失，即不需要包括不同数据项的变换视图的“负样例”。。。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用自举潜在表示的自监督表示学习
[0001]相关申请的交叉引用
[0002]本申请要求2020年6月5日提交的美国临时申请第63/035,583号和2020年6月15日提交的美国临时申请第63/039,343号的优先权。该在先申请的公开内容被认为是本申请公开内容的一部分，并通过引用并入于此。

技术介绍

[0003]本说明书涉及使用机器学习模型的图像处理。
[0004]神经网络是采用一层或多层非线性单元对接收到的输入来预测输出的机器学习模型。除了输出层之外，一些神经网络还包括一个或多个隐藏层。每个隐藏层的输出被用作网络中下一个层的输入，即下一个隐藏层或输出层。网络的每一层根据相应参数集的当前值从接收到的输入生成输出。

技术实现思路

[0005]本说明书描述了一种被实现为位于一个或多个位置的一个或多个计算机上的计算机程序的系统，该系统被配置成通过自监督学习过程来学习诸如图像之类的数据项的表示。
[0006]本公开的第一方面提供了一种计算机实现的训练神经网络的方法。该方法包括：用目标神经网络处理训练数据项(例如图像)的第一变换视图以生成目标输出，用在线神经网络处理训练数据项(例如图像)的第二变换视图以生成目标输出的预测，更新在线神经网络的参数以最小化目标输出的预测和目标输出之间的误差，以及基于在线神经网络的参数更新目标神经网络的参数。
[0007]术语“变换视图”是指例如图像之类的训练数据项的变换版本，并且用于将训练数据项经历了变换(例如图像变换)之后的训练数据项与原始(未变换的)训练数据项...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种训练神经网络的计算机实现的方法，该方法包括:利用目标神经网络处理训练数据项的第一变换视图，以生成目标输出；利用在线神经网络处理所述训练数据项的第二变换视图，以生成所述目标输出的预测；更新所述在线神经网络的一个或多个参数，以最小化所述目标输出的预测和所述目标输出之间的误差；和基于所述在线神经网络的参数更新所述目标神经网络的一个或多个参数。2.根据权利要求1所述的方法，其中，更新所述目标神经网络的一个或多个参数包括：利用所述在线神经网络的参数的移动平均值来更新所述目标神经网络的一个或多个参数。3.根据权利要求1或2所述的方法，其中，更新所述目标神经网络的一个或多个参数包括：根据ξ
←
τξ+(1
‑
τ)θ来确定所述目标神经网络的所述一个或多个参数的更新值，其中，ξ代表所述目标神经网络的参数，θ代表所述在线神经网络的参数，并且t是衰减率。4.根据前述权利要求中任一项所述的方法，其中，所述在线神经网络和所述目标神经网络各自包括相应的编码器神经网络，并且其中，所述方法进一步包括由每个编码器神经网络执行包括以下的操作：接收所述训练数据项的变换视图；和处理所述训练数据项的变换视图以生成所述训练数据项的表示。5.根据权利要求4所述的方法，其中，每个编码器神经网络包括残差神经网络。6.根据权利要求4
‑
5中任一项所述的方法，其中，所述在线神经网络和所述目标神经网络各自包括相应的投影神经网络，并且其中，所述方法进一步包括由每个投影神经网络执行包括以下的操作：接收所述训练数据项的表示；和处理所述训练数据项的表示以降低所述表示的维度。7.根据权利要求6所述的方法，其中，每个投影神经网络包括多层感知器。8.根据权利要求4
‑
7中任一项所述的方法，其中，所述在线神经网络包括预测神经网络，其中，所述方法进一步包括通过所述预测神经网络执行包括以下的操作：接收所述训练数据项的表示；和使用由所述预测神经网络的参数体现的回归模型来处理所述训练数据项的表示，以生成所述目标输出的预测。9.根据权利要求8所述的方法，其中，所述预测神经网络包括多层感知器。10.根据前述权利要求中任一项所述的方法，进一步包括：将所述在线神经网络和/或所述目标神经网络的参数初始化为随机值。11.根据前述权利要求中任一项所述的方法，进一步包括：对所述训练数据项应用第一数据项变换，以生成所...

【专利技术属性】
技术研发人员：JBFL格里尔，F施特鲁布，F阿尔奇，C塔莱克，P里士满，BA皮雷斯，Z郭，MG阿扎尔，B皮奥特，R穆诺斯，M瓦尔科，
申请(专利权)人：渊慧科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人