深度可分离卷积和批规范化融合的方法技术

技术编号：23853875 阅读：32 留言：0更新日期：2020-04-18 10:03

本发明专利技术属于神经网络模型技术领域，具体为一种深度可分离卷积和批规范化融合的方法。本发明专利技术首先从训练好的含有深度可分离卷积和批规范化层的神经网络模型，导出的Pointwise卷积的参数和批规范化的参数，通过特别设计的方法，重新计算出一组新的参数，用于对Pointwise卷积的权重和偏置进行赋值，修改Pointwise卷积的权重和偏置；然后删除掉原先网络结构中的批规范化层的效果，将批规范化层的计算添加在在Pointwise卷积中，得到与深度可分离卷积和批规范化等效的深度可分离卷积层，实现卷积融合批规范化的效果。本发明专利技术可有效地减少计算量。

Deep separable convolution and batch normalization fusion

全部详细技术资料下载

【技术实现步骤摘要】
深度可分离卷积和批规范化融合的方法
本专利技术属于神经网络模型
，具体涉及一种深度可分离卷积和批规范化融合的方法。
技术介绍
神经网络技术，尤其是轻量级神经网络一直是研究和应用的热点话题。深度可分离卷积，其有效的使得卷积层的计算量大大化简，其将卷积分为了两个步骤，第一个步骤称之为Depthwise卷积，其利用分组卷积的思想，使得不同卷积层之间无相互计算，仅仅计算单层卷积的结果，从而大幅度减少实现卷积的计算量。第二个步骤称之为Pointwise卷积，其有效的将第一步Depthwise卷积学习到的特征进行重新融合，从而实现对于Depthwise特征仅仅来自于单层的不足。使得其两者整体达到近似传统神经网络卷积的效果。其具体实现一般是使用卷积核为1x1的卷积完成。批规范化层，由于可以有效的把神经网络中间层学习到的特征重新进行规范化，使得神经网络的梯度可以有效地在多层之间传递，从而使得深层神经网络的训练变得可能。其拥有四个参数，两个用来表示输入的均值和方差，使用均值和方差来让特征重新规范化。另外两个则是神经网络学习的参数，用于特征重构，实现让神经网络模型学习到的特征不被破坏。其和深度可分离卷积都是在实际的神经网络模型构建中，常常使用到的。因此如果可以将两者在实际应用的时候融合起来，就可以在实际应用中有效地减少计算量。
技术实现思路
本专利技术的目的在于提出一种融合深度可分离卷积和批规范化的方法，以有效地减少计算量。本专利技术提出的融合深度可分离卷积和批规范化的方法，训练好的含有深度可分...

【技术保护点】
1.一致深度可分离卷积和批规范化融合的方法，其特征在于，从训练好的含有深度可分离卷积和批规范化层的神经网络模型，导出的Pointwise卷积的参数和批规范化的参数，通过特别设计的计方法，重新计算出一组新的参数，用于对Pointwise卷积的权重和偏置进行赋值，修改Pointwise卷积的权重和偏置；然后删除掉原先网络结构中的批规范化层的效果，将批规范化层的计算添加在在Pointwise卷积中，得到与深度可分离卷积和批规范化等效的深度可分离卷积层，实现卷积融合批规范化的效果；具体步骤如下：/n(1)对于训练好的含有深度可分离卷积和批规范化层的神经网络模型，要求在深度可分离卷积和批规范化层之间没有非线性激活函数，首先导出深度可分离卷积的Pointwise卷积的权重w

【技术特征摘要】
1.一致深度可分离卷积和批规范化融合的方法，其特征在于，从训练好的含有深度可分离卷积和批规范化层的神经网络模型，导出的Pointwise卷积的参数和批规范化的参数，通过特别设计的计方法，重新计算出一组新的参数，用于对Pointwise卷积的权重和偏置进行赋值，修改Pointwise卷积的权重和偏置；然后删除掉原先网络结构中的批规范化层的效果，将批规范化层的计算添加在在Pointwise卷积中，得到与深度可分离卷积和批规范化等效的深度可分离卷积层，实现卷积融合批规范化的效果；具体步骤如下：
(1)对于训练好的含有深度可分离卷积和批规范化层的神经网络模型，要求在深度可分离卷积和批规范化层之间没有非线性激活函数，首先导出深度可分离卷积的Pointwise卷积的权重wpwConv和偏置项bpwConv，以及批规范化...

【专利技术属性】
技术研发人员：范益波，刘超，
申请(专利权)人：复旦大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人