生成用于神经网络输出层的输出制造技术

技术编号：31739341 阅读：17 留言：0更新日期：2022-01-05 16:17

本公开涉及生成用于神经网络输出层的输出。系统、方法和装置，包括编码在计算机存储介质上的计算机程序，用于通过神经网络处理网络输入，该神经网络具有后跟有softmax输出层的一个或多个初始神经网络层。一方面，该方法包括获得由所述一个或多个初始神经网络层产生的层输出，以及通过softmax输出层处理该层输出以产生神经网络输出。通过softmax输出层处理该层输出包括为每个可能输出值确定在多个层输出值中的出现次数；对出现在所述多个层输出值中的每个可能输出值，确定相应的求幂度量；通过根据各可能输出值的各出现次数来组合求幂度量，确定用于该层输出的归一化因子；以及对于每个层输出值，确定softmax概率值。确定softmax概率值。确定softmax概率值。

全部详细技术资料下载

【技术实现步骤摘要】
生成用于神经网络输出层的输出
[0001]分案说明
[0002]本申请属于申请日为2017年11月23日的中国专利技术专利申请201711183619.0的分案申请。

[0003]本说明书涉及生成用于神经网络输出层的输出。

技术介绍

[0004]神经网络是采用非线性单元的一层或多层来预测针对接收的输入的输出的机器学习模型。除了输出层之外，一些神经网络还包括一个或多个隐藏层。每个隐藏层的输出被用作网络中的另一层，即下一隐藏层或输出层的输入。网络的每一层根据相应的参数集的当前值，从所接收的输入生成输出。

技术实现思路

[0005]本说明书描述系统能够如何处理神经网络的输出。为此，系统确定在由神经网络的初始神经网络层生成的输出中可能输出值的有限集合的每个成员的出现次数。该系统通过对每个出现值确定相应的求幂度量，来对在初始神经网络层的输出中出现的每个值确定softmax层输出。
[0006]通常，在本说明书中描述的主题的一个创新方面能被体现在通过神经网络处理网络输入的方法中，该神经网络具有后跟有softmax输出层的一个或多个初始神经网络层，该方法包括如下动作：获得通过所述一个或多个初始神经网络层处理网络输入产生的层输出，该层输出具有多个层输出值，以及每个层输出值是可能输出值的预定有限集合中的相应一个；以及通过softmax输出层处理该层输出以产生用于该网络输入的神经网络输出，包括：对该预定有限集合中的每个可能输出值，确定该可能输出值在所述多个层输出值中的出现次数；对出现在所述多个层输...

【技术保护点】

【技术特征摘要】
1.一种通过神经网络处理网络输入的方法，所述神经网络具有后跟有softmax输出层的一个或多个初始神经网络层以生成所述网络输入的神经网络输出，所述方法包括：获得通过所述一个或多个初始神经网络层处理所述网络输入生成的层输出，其中，所述初始神经网络层由处理系统实现，所述处理系统使用量化运算执行由所述一个或多个初始神经网络层指定的计算，使得由所述处理系统生成的输出值仅能够从值的预定有限集合中取值，并且其中：所述层输出具有多个层输出值，和每个层输出值是可能输出值的预定有限集合中的相应一个可能输出值；以及通过所述softmax输出层对所述层输出进行处理，以生成所述网络输入的所述神经网络输出，包括：对所述可能输出值的预定有限集合中的每个可能输出值，确定所述可能输出值在所述层输出中的所述多个层输出值当中的出现计数；对至少一次出现在所述多个层输出值中的每个可能输出值，确定所述可能输出值的相应的求幂度量；通过根据所述可能输出值的所述出现计数来组合所述求幂度量，确定用于所述层输出的归一化因子；以及对所述多个层输出值中的每一个层输出值，从用于所述层输出值的相应的求幂度量和用于所述层输出的所述归一化因子，确定softmax概率值。2.如权利要求1所述的方法，其中，获得所述层输出包括：从所述处理系统接收多个初始层输出值，所述多个初始层输出值是所述一个或多个初始神经网络层的未映射输出值，所述未映射输出值中的每一个是所述值的预定有限集合中的相应一个值；获得映射数据，所述映射数据定义从所述值的预定有限集合到所述可能层输出值的预定有限集合的映射；以及对每个初始层输出值，基于所述映射数据确定层输出值。3.如权利要求2所述的方法，其中，所述映射数据指定用于缩放所述多个初始层输出值中的每一个以生成所述层输出值的缩放因子。4.如权利要求1所述的方法，其中，所述可能输出值的有限集合中的每一个可能输出值映射到整数数据类型的相应值。5.如权利要求1所述的方法，其中，所述网络输入包括一个或多个浮点值，并且所述方法还包括：通过将所述一个或多个浮点值转换为定点值来从所述网络输入生成修改的网络输入；和将所述修改的网络输入作为输入提供给所述处理系统，以便由所述一个或多个初始浮点值进行处理。6.如权利要求1所述的方法，其中，确定所述可能输出值的相应的求幂度量包括：通过每个相应的可能输出值的乘积求幂欧拉数。7.如权利要求1所述的方法，其中，通过将每个相应的求幂度量除以所述归一化因子来确定每个softmax概率值。
8.如权利要求1所述的方法，其中，所述可能输出值的有限集合中的每一个可能输出值是映射函数的输出。9.如权利要求1所述的方法，其中，所述可能输出值的有限集合中的每一个可能输出值是压缩函数的输出。10.如权利要求1所述的方法，还包括在获得所述层输出之前：对所述可能输出值的预定有限集合中的每一个可能输出值，确定预先计算的求幂度量；和存储每个预先计算的求幂度量；并且其中，对出现在所述多个层输出值中的每一个可能输出值确定所述相应的求幂度量包括访问该可能的输出值的所存储的预先计算的求幂度量。11.一种包括一个或多个计算机和一个或多个存储设备的系统，所述一个或多个存储设备存储指令，所述指令在由所述一个或多个计算机执行时，能够操作以使所述一个或多个计算机执行操作，以通过神经网络处理网络输入，所述神经网络具有后跟有softmax输出层的一个或多个初始神经网络层以生成所述网络输入的神经网络输出，所述操作包括：获得通过所述一个或多个初始神经网络层处理所述网络输入生成的层输出，其中，所述初始神经网络层由处理系统实现，所述处理系统...

【专利技术属性】
技术研发人员：雷吉纳尔德，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人