【技术实现步骤摘要】
网络模型裁剪方法、装置及计算机可读取存储介质
本专利技术涉及深度学习网络领域,具体而言,涉及一种网络模型裁剪方法、装置及计算机可读取存储介质。
技术介绍
卷积神经网络是一种特殊的深层的神经网络模型,它的非全连接和权值共享的网络结构使之更类似于生物神经网络,使其网络模型的复杂度更低,权值数量更少,准确度也更高,在神经网络模型中应用也最为广泛。然而,卷积神经网络朝着更深的方向发展,网络的参数量和卷积操作也在大量提升,导致其浮点计算量也相当的大,这给模型部署在实际产品带来了极大的限制,对于硬件的计算能力要求也越来越高,目前降低浮点计算量主要是以裁剪网络模型为主要手段,然而卷积神经网络的网络模型繁多,很难依据不同的情况对网络模型进行裁剪。
技术实现思路
本专利技术实施例的目的在于提供一种网络模型裁剪方法、装置及计算机可读取存储介质,用以解决上述问题。为了实现上述目的,本专利技术实施例采用的技术方案如下:第一方面,本专利技术实施例提出一种网络模型裁剪方法,所述方法包括:当从待剪网络模型中识别 ...
【技术保护点】
1.一种网络模型裁剪方法,其特征在于,所述方法包括:/n当从待剪网络模型中识别出特定层时,依据所述特定层确定多个待剪卷积层;/n从所述待剪卷积层中确定待剪卷积核和/或待剪卷积通道;/n裁剪所述待剪卷积核和/或待剪卷积通道。/n
【技术特征摘要】
1.一种网络模型裁剪方法,其特征在于,所述方法包括:
当从待剪网络模型中识别出特定层时,依据所述特定层确定多个待剪卷积层;
从所述待剪卷积层中确定待剪卷积核和/或待剪卷积通道;
裁剪所述待剪卷积核和/或待剪卷积通道。
2.如权利要求1所述的网络模型裁剪方法,其特征在于,所述依据所述特定层确定多个待剪卷积层包括:
根据所述特定层识别待剪网络模型所属的模型类别;
依据所述模型类别确定多个待剪卷积层。
3.如权利要求2所述的网络模型裁剪方法,其特征在于,当所述特定层包括深度卷积层depthwiseconvolutions时,所述依据所述特定层确定多个待剪卷积层的步骤包括:
将所述depthwiseconvolutions、对应的第一卷积层及对应的第二卷积层作为所述待剪卷积层;其中,所述对应的第一卷积层为所述depthwiseconvolutions的相邻上一层,所述对应的第二卷积层为所述depthwiseconvolutions的相邻下一层。
4.如权利要求3所述的网络模型裁剪方法,其特征在于,所述从所述待剪卷积层中确定待剪卷积核或待剪卷积通道的步骤包括:
当依据所述第一卷积层的输出偏差从所述第一卷积层中确定出至少一个第一卷积核时,依据所述第一卷积核从所述depthwiseconvolutions中确定对应的第二卷积核及依据所述第一卷积核从所述第二卷积层中确定所述待剪卷积通道;
将所述第一卷积核和所述第二卷积核确定为所述待剪卷积核。
5.如权利要求3所述的网络模型裁剪方法,其特征在于,所述从所述待剪卷积层中确定待剪卷积核或待剪卷积通道的步骤包括:
当依据所述depthwiseconvolutions的输出偏差从所述depthwiseconvolutions中确定出至少一个第二卷积核时,依据所述第二卷积核从所述第一卷积层中确定对应的第一卷积核及依据所述第二卷积核从所述第二卷积层中确定所述待剪卷积通道;
将所述第一卷积核和所述第二卷积核确定为所述待剪卷积核。
6.如权利要求3所述的网络模型裁剪方法,其特征在于,所述从所述待剪卷积层中确定待剪卷积核或待剪卷积通道的步骤包括:
当依据所述depthwiseconvolutions和第一卷积层对应的数据叠加输出偏差从所述depthwiseconvolutions和第一卷积层中确定出至少一个所述待剪卷积核时,依据所述待剪卷积核从所述第二卷积层中确定所述待剪卷积通道。
7.如权利要求1所...
【专利技术属性】
技术研发人员:孔露森,陈航锋,
申请(专利权)人:浙江宇视科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。