学习统一嵌入制造技术

技术编号：22662498 阅读：31 留言：0更新日期：2019-11-28 05:01

描述了一种用于在数据处理装置上使用神经网络生成统一机器学习模型的计算机实施的方法。该方法包括数据处理装置为多个对象顶点中的每一个确定相应学习目标。数据处理装置基于神经网络的两个或更多个嵌入输出来确定相应学习目标。该方法还包括数据处理装置训练神经网络以识别与多个对象顶点中的每一个相关联的数据。数据处理装置使用相应学习目标并基于第一损失函数来训练神经网络。数据处理装置使用经训练的神经网络来生成统一机器学习模型，其中该模型被配置为识别与多个对象顶点中的每一个相关联的特定数据项。

Unified learning embedding

This paper describes a computer implementation method for generating a unified machine learning model using neural networks on data processing devices. The method includes a data processing device to determine a corresponding learning target for each of a plurality of object vertices. The data processing device determines the corresponding learning target based on two or more embedded outputs of the neural network. The method also includes data processing apparatus training neural network to identify the data associated with each vertex of multiple objects. The data processing device uses the corresponding learning target and trains the neural network based on the first loss function. The data processing apparatus uses a trained neural network to generate a unified machine learning model, which is configured to identify specific data items associated with each of a plurality of object vertices.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】学习统一嵌入
技术介绍
本说明书涉及训练统一(unified)神经网络模型。神经网络是机器学习模型，其采用一层或多层操作来为接收的输入生成输出，例如分类。一些神经网络除了输出层之外还包括一个或多个隐藏层。每个隐藏层的输出被用作网络中下一层(即网络的下一隐藏层或输出层)的输入。网络的一些或所有层按照相应参数集的当前值从接收的输入生成输出。一些神经网络包括一个或多个卷积神经网络层。每个卷积神经网络层具有一组相关联的内核。每个内核包括由用户创建的神经网络模型建立的值。在一些实施方式中，内核识别特定图像轮廓、形状或颜色。内核可以表示为权重输入的矩阵结构。每个卷积层也可以处理激活输入的集合。该激活输入的集合也可以表示为矩阵结构。
技术实现思路
本说明书描述了用于在数据处理装置上使用神经网络生成统一机器学习模型的系统和方法。根据所描述的技术，数据处理装置为一组对象顶点中的每个对象顶点确定学习目标。数据处理装置可以基于神经网络的两个或更多个嵌入(embedding)输出来确定每个学习目标。每个嵌入输出可以由使用三元组损失函数(tripletlossfunction)单独训练的独立专用模型生成。每个专用模型被配置为识别与特定对象顶点相关联的数据。当数据处理装置训练神经网络以识别与组中的每个对象顶点相关联的数据时，生成统一机器学习模型。数据处理装置基于L2损失函数并使用专用模型的相应学习目标来训练神经网络。数据处理装置使用经训练的神经网络来生成统一机器学习模型。统一模型可以被配置为识别包括对象顶点中的每一个中的项的对象表...

【技术保护点】
1.一种用于在数据处理装置上使用神经网络生成统一机器学习计算模型的计算机实施的方法，所述方法包括：/n由数据处理装置并且为神经网络确定多个对象顶点中的每一个的相应学习目标，其中，每个对象顶点定义属于所述顶点的对象的不同类别；/n由数据处理装置并且基于第一损失函数来训练神经网络，以识别与所述多个对象顶点中的每一个相关联的数据，其中，所述神经网络是使用相应学习目标来训练的；以及/n由数据处理装置并且使用基于第一损失函数训练的神经网络生成统一机器学习模型，所述统一机器学习模型被配置为识别包括在与所述多个对象顶点中的每一个相关联的数据中的项。/n

【技术特征摘要】
【国外来华专利技术】20170717 US 62/533,5351.一种用于在数据处理装置上使用神经网络生成统一机器学习计算模型的计算机实施的方法，所述方法包括：
由数据处理装置并且为神经网络确定多个对象顶点中的每一个的相应学习目标，其中，每个对象顶点定义属于所述顶点的对象的不同类别；
由数据处理装置并且基于第一损失函数来训练神经网络，以识别与所述多个对象顶点中的每一个相关联的数据，其中，所述神经网络是使用相应学习目标来训练的；以及
由数据处理装置并且使用基于第一损失函数训练的神经网络生成统一机器学习模型，所述统一机器学习模型被配置为识别包括在与所述多个对象顶点中的每一个相关联的数据中的项。

2.根据权利要求1所述的方法，其中，为所述神经网络确定相应学习目标还包括：
由所述数据处理装置并且基于第二损失函数训练至少一个其它神经网络，以识别与所述多个对象顶点中的每一个相关联的数据；
响应于训练，由数据处理装置生成两个或更多个嵌入输出，其中，每个嵌入输出指示特定学习目标并且包括对应于与特定对象顶点相关联的数据的参数的向量；以及
由数据处理装置并且使用基于第二损失函数训练的所述至少一个其它神经网络生成相应机器学习模型，每个机器学习模型被配置为使用特定嵌入输出。

3.根据权利要求2所述的方法，其中，为所述神经网络确定相应学习目标还包括：
提供从相应独立模型生成的相应学习目标，用于训练所述神经网络。

4.根据权利要求2或3所述的方法，其中，所述多个对象顶点中的每一个对应于项的特定类别，并且与所述多个对象顶点中的每一个相关联的数据包括项的所述特定类别中的项的图像数据。

5.根据权利要求4所述的方法，其中，所述特定类别是服饰类别，并且所述特定类别的项包括以下各项中的至少一个：手提包、鞋子、连衣裙、裤子或外套；以及
其中，所述图像数据指示以下各项中的至少一个的图像：特定手提包、特定鞋子、特定连衣裙、特定裤子或特定外套。

6.根据权利要求5所述的方法，其中：
所述相应机器学习模型中的每一个被配置为识别与特定对象顶点相关联的数据且在第一准确度内；并且
所述统一机器学习模型被配置为识别与所述多个对象顶点中的每一个相关联的数据且在超过所述第一准确度的第二准确度内。

7.根据权利要求2至6中任一项所述的方法，其中，确定所述多个对象顶点中的每一个的相应学习目标包括：
分析所述两个或更多个嵌入输出，每个嵌入输出对应于所述多个对象顶点中的特定对象顶点；以及
基于所述分析，确定所述多个对象顶点中的每一个的相应学习目标。

8.根据权利要求2至7中任一项所述的方法，其中，所述第一损失函数是L2损失函数，并且生成所述统一机器学习模型包括：
生成最小化与所述L2损失函数相关联的计算输出的特定统一机器学习模型。

9.根据权利要求2至8中任一项所述的方法，其中，所述神经网络包括接收多个层输入的多个神经网络层，并且其中，基于所述第一损失函数训练所述神经网络包括：
执行批量规范化以规范化到特定神经网络层的层输入；以及
响应于执行批量规范化，最小化协变量偏移。

10.根据权利要求2至9中任一项所述的方法，其中，所述第二损失函数是三元组损失函数，并且生成所述相应机器学习模型包括：
基于锚图像、正图像和负图像之间的关联生成特定机器学习模型。

11.根据前述权利要求中任一项所述的方法，其中，与所述多个对象顶点中的每一个相关联的数据包括图像数据。

12.一种用于使用神经网络生成统一机器学习计算模型的系统，所述计算系统包括：
用于神经网络的数据处理装置，所述数据处理装置包括一个或多个处理设备；以及
一个或多个非暂时性机器可读存储设备，用于存储可由所述一个或多个处理设备运行以使得执行包括根据任一前述权利要求的方法的操作的指令。

13.一个或多个非暂时性机器可读存储设备，用于存储可由一个或多个处理设备运行以使得执行包括根据权利要求1至10中任一项的方法的操作的指令。

14.一种用于在数据处理装置上使用神经网络生成统一机器学习计算模型的计算机实施的方法，所述方法包括：
由数据处理装置并且为神经网络确定多个对象顶点中的每一个的相应学习目标，其中，每个对象顶点定义属于所述顶点的对象的不同类别；
由数据处理装置并且基于第一损失函数来训练神经网络，以识别与所述多个对象顶点中的每一个相关联的数据，其中，所述神经网络是使用相应学习目标来训练的；以及
由数据处理装置并且使用基于第一损失函数训练的神经网络生成统一机器学习模型，所述统一机器学习模型被配置为识别包括在与所述多个对象顶点中的每一个相关联的数据中的项。

15.根据权利要求14所述的方法，其中，为所述神经网络确定相应学习目标还包括：
由所述数据处理装置并且基于第二损失函数训练至少一个其它神经网络，以识别与所述多个对象顶点中的每一个相关联的数据；
响应于训练，由数据处理装置生成两个或更多个嵌入输出，其中，每个嵌入输出指示特定学习目标并且包括对应于与特定对象顶点相关联的数据的参数的向量；以及
由数据处理装置并且使用基于第二损失函数训练的所述至少一个其它神经网络生成相应机器学习模型，每个机器学习模型被配置为使用特定嵌入输出。

16.根据权利要求15所述的方法，其中，为所述神经网络确定相应学习目标还包括：
提供从相应独立模型生成的相应学习目标，用于训练所述神经网络。

17.根据权利要求15所述的方法，其中，所述多个对象顶点中的每一个对应于项的特定类别，并且与所述多个对象顶点中的每一个相关联的数据包括项的所述特定类别中...

【专利技术属性】
技术研发人员：宋扬，李源，武勃，CY陈，张晓，H亚当，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人