归一化处理方法、装置和计算机设备制造方法及图纸

技术编号：31664098 阅读：16 留言：0更新日期：2022-01-01 10:02

本申请提供了一种归一化处理方法，涉及人工智能领域，该归一化处理方法包括：批归一化BN层获取卷积神经网络中的多个数据样本，该多个数据样本为卷积神经网络中卷积层的输出结果；该BN层在正向传播的计算过程中，根据该多个数据样本并行计算该多个数据样本对应的均值以及方差；该BN层根据该多个数据样本对应的均值以及方差，对该多个数据样本进行处理以得到BN层的处理结果。本申请能够降低卷积神经网络的执行时间，提高卷积神经网络的执行效率。提高卷积神经网络的执行效率。提高卷积神经网络的执行效率。

全部详细技术资料下载

【技术实现步骤摘要】
归一化处理方法、装置和计算机设备

[0001]本申请涉及人工智能领域，并且更具体地，涉及一种归一化处理方法、装置和计算机设备。

技术介绍

[0002]人工智能(artificial intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能领域的研究包括机器人，自然语言处理，计算机视觉，决策与推理，人机交互，推荐与搜索，AI基础理论等。
[0003]随着对卷积神经网络的深入研究，其执行效率或执行时间成为研究的热点。相关的技术方案中，对降低卷积层的执行时间研究较多，而对于降低卷积神经网络中的非卷积层(例如，批归一化(batch normalize，BN)层)的研究较少。
[0004]因此，如何降低卷积神经网络中的非卷积层(例如，BN层)的执行时间，提高非卷积层的执行效率成为当前亟需要解决的问题。

技术实现思路

[0005]本申请实施例提供了一种归一化处理方法、装置以及计算机设备，可以降低卷积神经网络的执行时间，提高卷积神经网络的执行效率。
[0006]第一方面，提供了一种归一化处理方法，包括：批归一化BN层获取卷积神经网络中的多个数据样本，所述多个数据样本为所...

【技术保护点】

【技术特征摘要】
1.一种归一化处理方法，其特征在于，所述方法包括：批归一化BN层获取卷积神经网络中的多个数据样本，所述多个数据样本为所述卷积神经网络中卷积层的输出结果；所述BN层在正向传播的计算过程中，根据所述多个数据样本并行计算所述多个数据样本对应的均值以及方差；所述BN层根据所述多个数据样本对应的均值以及方差，对所述多个数据样本进行处理以得到所述BN层的处理结果。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：所述BN层确定所述卷积神经网络的损失，所述损失是根据目标值和所述卷积神经网络的预测值确定的，所述预测值是根据所述BN层的处理结果确定的；所述BN层在反向传播的计算过程中，并行计算所述损失对所述均值的偏导以及所述损失对所述方差的偏导。3.根据权利要求2所述的方法，其特征在于，所述BN层根据所述多个数据样本对应的均值以及方差，对所述多个数据样本进行处理，得到所述BN层的处理结果，包括：根据所述均值、所述方差、缩放参数以及平移参数对所述多个数据样本进行处理，得到所述BN层的处理结果；所述BN层在反向传播的计算过程中，并行计算所述损失对所述均值的偏导以及所述损失对所述方差的偏导，包括：所述BN层在反向传播的计算过程中，根据所述损失分别计算所述缩放参数的偏导和所述平移参数的偏导；所述BN层根据所述缩放参数的偏导和所述平移参数的偏导，并行计算所述损失对所述均值的偏导以及所述损失对所述方差的偏导。4.根据权利要求1至3中任一项所述的方法，其特征在于，所述多个数据样本存储在本地缓存中，所述批归一化BN层获取卷积神经网络中的多个数据样本，包括：所述BN层从所述本地缓存中获取所述多个数据样本。5.根据权利要求1至4中任一项所述的方法，其特征在于，所述方法还包括：所述BN层将所述BN层的处理结果存储在本地缓存中。6.根据权利要求5所述的方法，其特征在于，所述BN层的下一层为池化层和卷积层。7.根据权利要求1至6中任一项所述的方法，其特征在于，所述BN层根据如下公式并行计算所述多个数据样本对应的均值和方差，计算所述多个数据样本对应的均值和方差，其中，m表示所述多个数据样本的数量，i表示所述m个中的第i个，x
i
表示所述多个数据样本中的第i个数据样本，μ
B
表示所述多个数据样本对应的均值，表示所述多个数据样本对应的方差。
8.根据权利要求2至7中任一项所述的方法，其特征在于，所述BN层根据如下公式并行计算所述损失对所述均值的偏导以及所述损失对所述方差的偏导，计算所述损失对所述均值的偏导以及所述损失对所述方差的偏导，其中，E表示所述损失，m表示所述多个数据样本的数量，i表示所述m个中的第i个，表示第i个数据样本归一化后的样本点，表示所述损失对所述均值的偏导，β表示所述平移参数，表示所述平移参数的偏导，α表示所述缩放参数，表示所述缩放参数的偏导，ε表示归一化参数，表示所述损失对所述方差的偏导。9.一种归一化处理装置，其特征在于，包括：获取模块，用于批归一化BN层获取卷积神经网络中的多个数据样本，所述多个数据样本为所述卷积神...

【专利技术属性】
技术研发人员：余辉，张敏仪，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人