卷积神经网络的优化方法、装置、存储介质和系统制造方法及图纸

技术编号：21116753 阅读：25 留言：0更新日期：2019-05-16 09:17

本申请涉及一种卷积神经网络优化方法、装置、存储介质和系统。所述方法包括：将冗余神经网络层的卷积计算融合到卷积层中，并删除多余的神经网络层。采用本方法能够使优化后的网络网络性能大幅度提升。

Optimizing methods, devices, storage media and systems of convolutional neural networks

全部详细技术资料下载

【技术实现步骤摘要】
卷积神经网络的优化方法、装置、存储介质和系统
本申请涉及人工智能
，特别是涉及一种卷积神经网络的优化方法、装置、存储介质和系统。
技术介绍
卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一类包含卷积计算且具有深度结构的多层神经网络，是深度学习的代表算法之一，擅长处理图像特别是大图像的相关机器学习问题。随着数字电子技术的不断发展，各类人工智能(ArtificialIntelligence，AI)芯片的快速发展对于神经网络处理器的要求也越来越高。卷积神经网络算法作为智能芯片广泛应用的算法之一，运行于神经网络处理器中。然而，传统的卷积神经网络结构中存在大量连续的Convolution，BatchNorm，Scale层结构，在进行前向传播时，BatchNorm层和Scale层的构建和执行消耗了大量计算资源，并且在执行卷积计算过程中并没有起到太大作用，反而让网络结构重复、复杂。
技术实现思路
基于此，有必要针对上述技术问题，提供一种能够优化卷积神经网络结构的的卷积神经网络优化方法、装置、存储介质和系统。一种卷积神经网络优化方法，所述方法包括：获取配置参数，其中，所述配置参数包括BatchNorm层的第一训练参数及BatchNorm层的第二训练参数；将所述BatchNorm层的第一训练参数与卷积层的权值参数融合，得到第一融合结果；将所述BatchNorm层的第二训练参数与卷积层的偏置参数融合，得到第二融合结果；根据所述第一融合结果以及所述第二融合结果，对所述卷积神经网络进行优化。在其中一个实施例中，所述将所述BatchNorm层的第...

【技术保护点】
1.一种卷积神经网络优化方法，其特征在于，所述方法包括：获取配置参数，其中，所述配置参数包括Batch Norm层的第一训练参数及Batch Norm层的第二训练参数；将所述Batch Norm层的第一训练参数与卷积层的权值参数融合，得到第一融合结果；将所述Batch Norm层的第二训练参数与卷积层的偏置参数融合，得到第二融合结果；根据所述第一融合结果以及所述第二融合结果，对所述卷积神经网络进行优化。

【技术特征摘要】
1.一种卷积神经网络优化方法，其特征在于，所述方法包括：获取配置参数，其中，所述配置参数包括BatchNorm层的第一训练参数及BatchNorm层的第二训练参数；将所述BatchNorm层的第一训练参数与卷积层的权值参数融合，得到第一融合结果；将所述BatchNorm层的第二训练参数与卷积层的偏置参数融合，得到第二融合结果；根据所述第一融合结果以及所述第二融合结果，对所述卷积神经网络进行优化。2.根据权利要求1所述的方法，其特征在于，所述将所述BatchNorm层的第一训练参数与卷积层的权值参数融合，得到第一融合结果，包括：将所述BatchNorm层的第一训练参数以及所述卷积层的权值参数进行乘法运算，得到所述第一融合结果。3.根据权利要求1所述的方法，其特征在于，所述将所述BatchNorm层的第二训练参数与卷积层的偏置参数融合，得到第二融合结果，包括：将所述BatchNorm层的第二训练参数以及所述卷积层的偏置参数进行加法运算，得到所述第二融合结果。4.根据权利要求1所述的方法，其特征在于，所述根据所述第一融合结果以及所述第二融合结果，对所述卷积神经网络进行优化，包括：删除所述BatchNorm层，并将所述卷积层的权值参数更改为所述第一融合结果，将所述卷积层的偏置参数更改为所述第二融合结果。5.根据权利要求1所述的方法，其特征在于，所述方法还包括：将卷积层的输入数据分别与所述第一融合结果和所述第二融合结果进行卷积计算，得到卷积层的输出结果。6.根据权利要求5所述的方法，其特征在于，所述将卷积层的输入数据分别与所述第一融合结果和所述第二融合结果进行卷积计算，得到卷积层的输出结果，包括：将所述输入数据与所述第一融合结果进行乘法运算，得到第一运算结果；将所述第一运算结果与所述第二融合结果进行加法运算，得到所述输出结果。7.根据权利要求1所述的方法，其特征在于，所述BatchNorm层的第一训练参数包括用于执行BatchNorm层的卷积计算的至少一个第一训练子参数；所述BatchNorm层的第二训练参数包括用于执行BatchNorm层的卷积计算的至少一个第二训练子参数。8.根据权利要求7所述的方法，其特征在于，若所述BatchNorm层的第一训练参数包括多个第一训练子参数，则将所述多个第一训练子参数进行运算，得到第一中间运算结果；将所述第一中间运算结果以及所述Scale层的第一训练参数与所述卷积层的权值参数融合，得到所述第一融合结果。9.根据权利要求7所述的方法，其特征在于，若所述BatchN...

【专利技术属性】
技术研发人员：不公告发明人，
申请(专利权)人：北京中科寒武纪科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人