用于非线性归一化的神经网络层制造技术

技术编号：39422153 阅读：7 留言：0更新日期：2023-11-19 16:10

用于非线性归一化的神经网络层。计算机实现的机器学习系统(60)，其中机器学习系统(60)被配置为通过经由机器学习系统(60)的多个层(L，61)转发输入信号(x)来基于输入信号(x)提供输出信号(y)，其中多个层(L，61)中的至少一个层(61)被配置为接收基于输入信号(x)的层输入(l)，并且提供层输出(o)，基于该层输出(o)确定输出信号(y)，其中层(61)的特征在于层(61)被配置为借助于层输入(l)的非线性归一化来确定层输出(l)。定层输出(l)。定层输出(l)。

全部详细技术资料下载

【技术实现步骤摘要】
用于非线性归一化的神经网络层

[0001]本专利技术涉及计算机实现的机器学习系统、用于训练机器学习系统的计算机实现的方法、用于在机器学习系统上执行推断的计算机实现的方法、计算机程序和机器可读存储介质。
现有技术
[0002]Ioffe和Szegedy的“Batch Normalization：Accelerating Deep Network Training by Reducing Internal Covariate Shift”(2015，https：//arxiv.org/abs/1502.03167)公开了批量规范(Batch Norm，BN)，这是一种在神经网络训练期间归一化小批量的方法。
[0003]Wu和He的“Group Normalization”(2018，https：//arxiv.org/abs/1803.08494)公开了组归一化(GN)作为BN的简单替代。GN将通道划分成组，并在每个组内计算归一化的均值和方差。
[0004]Ba等人的“Layer Normalization”(2016，https：//arxiv.org/abs/1607.06450)公开了一种称为层归一化(LN)的方法，这是BN的转置应用。
[0005]Ulyanov等人的“Instance Normalization：The Missing Ingredient for Fast Stylization”(2016，https：//arxiv，org/abs/1607.08022)公开了一种称...

【技术保护点】

【技术特征摘要】
1.一种计算机实现的机器学习系统(60)，其中所述机器学习系统(60)被配置为通过经由机器学习系统(60)的多个层(L，61)转发输入信号(x)来基于输入信号(x)提供输出信号(y)，其中所述多个层(L，61)中的至少一个层(61)被配置为接收基于输入信号(x)的层输入(l)，并且提供层输出(o)，基于所述层输出(o)确定输出信号(y)，其中所述层(61)的特征在于层(61)被配置为借助于层输入(l)的非线性归一化来确定层输出(l)。2.根据权利要求1所述的机器学习系统(60)，其中为了确定层输出，所述层被配置为归一化层输入(l)的至少一组值，其中所述组包括层输入(l)的所有值或者层输入(l)的值的子集。3.根据权利要求2所述的机器学习系统(60)，其中所述非线性归一化的特征在于，将来自所述组的值的经验百分位数映射到预定义概率分布的百分位数。4.根据权利要求3所述的机器学习系统(60)，其中所述预定义概率分布是标准正态分布。5.根据权利要求3或4所述的机器学习系统(60)，其中确定层输出(o)包括以下步骤：
·
接收层输入(l)的一组值；
·
对接收到的值进行排序；
·
计算排序值的每个位置的百分位数值；
·
借助于预定义...

【专利技术属性】
技术研发人员：J，
申请(专利权)人：罗伯特，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人