【技术实现步骤摘要】
【国外来华专利技术】鲁棒且可更好训练的人工神经网络
[0001]本专利技术涉及人工神经网络,特别是用于确定物理测量数据的分类、回归和/或语义分割。
技术介绍
[0002]对于车辆在道路交通中的至少部分自动驾驶而言,需要观察该车辆的环境并识别该环境中包含的对象,并且必要时确定这些对象相对于自己车辆的位置。然后可以在此基础上决定这些对象的存在和/或已识别的运动是否使得需要改变自己车辆的行为。
[0003]例如,由于用相机对车辆环境的光学成像会受到大量影响因素的影响,因此同一风景的两个成像不会完全相同。因此,为了识别对象典型地使用具有理想大小的泛化能力的人工神经网络KNN。这些KNN被训练为使得它们根据成本函数将学习输入数据很好地映射为学习输出数据。然后预计KNN也将在不是该训练主题的状况下正确识别对象。
[0004]在具有很多层的深度网络的情况下,有问题的是无法控制由该网络处理的数据的数值以多大数量级移动。例如,在该网络的第一层中可能存在0到1范围内的数字,而在更深层中可以达到数量级为1000的数值。于是输入变量的微小变化可能引起输出变量的巨大变化。这可能导致该网络“不学习”,即识别命中率没有明显超过随机猜测的命中率。
[0005](S. Ioffe, C. Szegedy,
ꢀ“
Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift”, arXiv: 1502.0316 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种人工神经网络KNN(1),具有大量串联的处理层(21
‑
23),每个处理层都被构造为根据所述KNN(1)的可训练参数(20)将输入变量(21a
‑
23a)处理为输出变量(21b
‑
23b),其中在至少一个处理层(21
‑
23)中和/或在至少两个处理层(21
‑
23)之间连接至少一个标准化器(3),其中所述标准化器(3)
•
包括翻译元件(3a),所述翻译元件被构造为使用预给定变换(3a')将引入所述标准化器(3)的输入变量(31)翻译为一个或多个输入向量(32),其中每个输入变量(31)恰好进入一个输入向量(32)中;
•
包括标准化元件(3b),所述标准化元件被构造为基于标准化函数(33)将所述一个或多个输入向量(32)标准化为一个或多个输出向量(34),其中所述标准化函数(33)具有至少两个不同的机制(33a,33b),并根据所述输入向量(32)在点处和/或在区域中的范数(32a)在所述机制(33a,33b)之间切换,所述点和/或所述区域的位置取决于预给定参数ρ;
•
包括回译元件(3c),所述回译元件被构造为使用所述预给定变换(3a')的逆(3a'')将所述输出向量(34)翻译为输出变量(35),所述输出变量与输送给所述标准化器(3)的输入变量(31)具有相同的维度。2.根据权利要求1所述的KNN(1),其中至少一个标准化函数(33)被构造为使范数(32a)小于参数ρ的输入向量(32)保持不变,并且将范数(32a)大于参数ρ的输入向量(32)在保持方向的条件下标准化为统一的范数(32a)。3.根据权利要求1至2中任一项所述的KNN(1),其中至少一个标准化函数(33)在不同机制(33a,33b)之间的切换由Softplus函数控制,当所述输入向量(32)的范数(32a)等于参数ρ时,Softplus函数的自变量具有过零点。4.根据权利要求1至3中任一项所述的KNN(1),其中至少一个预给定变换(3a')包括从输入变量(31)的张量(31')中将所有特征信息(31c)组合为一个或多个输入向量(32),在所述张量中组合了f个特征图(31a),每个特征图向n个不同的位置(31c)分配特征信息(31b)。5.根据权利要求4所述的KNN(1),其中对于f个特征图(31a)中的每一个特征图,至少一个预给定变换(3a')包括将包含在该特征图(31a)中的关于所有位置(31b)的特征信息(31c)组合在分配给该特征图(31a)的输入向量(32)中。6.根据权利要求4至5中任一项所述的KNN(1),其中对于n个位置(31b)中的每一个位置,至少一个预给定变换(3a')包括将通过所有特征图(31a)分配给该位置(31b)的特征信息(31c)组合在分配给该位置(31b)的输入向量(32)中。7.根据权利要求4至6中任一项所述的KNN(1),其中至少一个预给定变换(3a')包括将来自所述张量(31)的所有特征信息(31c)组合在唯一的输入向量(32)中。8.根据权利要求4至7中任一项所述的KNN(1),其中至少一个预给定变换(3a')包括将所有特征信息(31c)分别减去对所有特征信息(31c)形成的算术平均值。9.根据权利要求4至8中任一项所述的KNN(1),其中至少一个预给定变换(3a')包括将f个特征图(31a)的每个特征图中分别包含的特征信息(31c)分别减去所述特征信息(31c)的对该特征图(31a)形成的算术平均值(31c)。10.根据权利要求4至9中任一项所述的KNN(1),其中至少一个预给定变换(3a')包括将通过所有特征图(31a)分配给n个位置(31b)中每一个位置的特征信息(31c)分别减去属于该位置(31b)的特征信息(31c)的对所有特征图(31a)形成的算术平均值。
11.根据权利要求1至10中任一项所述的KNN(1),其中至少一个标准化器(3)获得处理层(21
‑
23)的输入变量(21a
‑
23a)的加权和作为输入变量(31),并且该标准化器(3)的输出变量(35)被引入非线性激活函数中以形成所述处理层(21
‑
23)的输出变量(21b
‑
23b)。12.根据权利要求1至11中任一项所述的KNN(1),其中至少一个标准化器(3)获得第一处理层(21
‑
23)的输出变量(21b
‑
23b)作为输入变量(31),所述输出变量是通过应用非线性激活函数形成的,并且其中该标准化器(3)的输出变量(35)作为输入变量(21a
‑
23a)被引入进一步的处理层(21
‑
23)中,所述进一步的处理层将所述输入变量(21a
‑
23a)根据所述可训练参数(20)加权地求和。13.根据权利要求1至12中任一项所述的KNN(1),被构造为分类器和/...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。