System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种深度神经网络模型的剪枝方法及相关组件技术_技高网
当前位置: 首页 > 专利查询>清华大学专利>正文

一种深度神经网络模型的剪枝方法及相关组件技术

技术编号:40787663 阅读:8 留言:0更新日期:2024-03-28 19:18
本发明专利技术提供一种深度神经网络模型的剪枝方法及相关组件,该方法包括:确定深度神经网络模型的权重矩阵;在稀疏计算平台上,基于离线阶段冗余筛除算法对权重矩阵的初步搜索空间进行修正,得到修正搜索空间;在修正搜索空间,基于在线阶段进化算法对权重矩阵进行迭代块稀疏剪枝。块稀疏可以同时在精度、稀疏度以及计算效率中做权衡,本发明专利技术通过离线阶段冗余筛除算法缩小了块剪枝的搜索空间,结合在线阶段进化算法迭代调整块剪枝来平衡推理精度和速度。

【技术实现步骤摘要】

本专利技术涉及神经网络,尤其涉及一种深度神经网络模型的剪枝方法及相关组件


技术介绍

1、深度神经网络模型近年来被广泛的应用于计算机视觉、图像识别图像分割、语音识别、自然语言处理、目标检测和自动驾驶等领域,并且取得了较好的效果。但深度神经网络模型出色的性能与其复杂的结构和自身庞大的参数量密切相关。深度神经网络模型对硬盘存储、内存带宽和计算资源占用很高,并且随着技术进步,深度神经网络模型结构趋于复杂的发展趋势,使得大规模的深度神经网络模型很难在嵌入式或终端设备等资源受限的平台上部署。为了将深度神经网络模型部署到资源受限的平台,就需要对深度神经网络模型进一步压缩,来实现保证性能的同时降低模型复杂度、模型计算量和提升推理速度的目标。

2、通过剪枝技术剪枝稀疏化模型,移除冗余参数,使剪枝后的模型得更加精简,算力消耗更少,且剪枝操作不会对模型精度造成损失,剪枝后模型通过稀疏计算库在不同硬件上提升推理速度。现有的剪枝技术可以分为两类:一类为非结构化剪枝,另一类为结构化剪枝。非结构化剪枝细粒度,稀疏度高,能够得到精度较好的稀疏模型,但是结构不规则,速度难以提升,无法较好地利用底层的稀疏计算库;结构化剪枝以通道或层为单位进行剪枝,粗粒度稀疏,修剪完的稀疏模型比较规则,方便部署在传统硬件上进行计算,但是会对于网络的精度造成较大的影响且稀疏度低。

3、因此,亟需设计出一种能够同时保证深度神经网络模型的速度和精度的剪枝方法。


技术实现思路

1、本专利技术提供一种深度神经网络模型的剪枝方法及相关组件,用以解决现有技术中无法同时保证深度神经网络模型的速度和精度的缺陷,本专利技术通过离线阶段冗余筛除算法缩小了块剪枝的搜索空间,结合在线阶段进化算法迭代调整块剪枝来平衡推理精度和速度。

2、本专利技术提供一种深度神经网络模型的剪枝方法,包括:确定所述深度神经网络模型的权重矩阵;在稀疏计算平台上,基于离线阶段冗余筛除算法对所述权重矩阵的初步搜索空间进行修正,得到修正搜索空间;在所述修正搜索空间,基于在线阶段进化算法对所述权重矩阵进行迭代块稀疏剪枝。

3、根据本专利技术提供的一种深度神经网络模型的剪枝方法,所述在稀疏计算平台上,基于离线阶段冗余筛除算法对所述权重矩阵的初步搜索空间进行修正,得到修正搜索空间,包括:基于离线阶段层间冗余筛除算法对所述权重矩阵对所述初步搜索空间进行层间修正,得到候选空间;根据所述权重矩阵建立模型延迟查询表;根据所述延迟查询表,基于离线阶段层内冗余筛除算法对所述候选空间进行层内修正,得到所述修正搜索空间。

4、根据本专利技术提供的一种深度神经网络模型的剪枝方法,所述基于离线阶段层间冗余筛除算法对所述权重矩阵对所述初步搜索空间进行层间修正,得到候选空间,包括:在所述初步搜索空间选择相同的块尺寸对矩阵共享层进行块稀疏剪枝,得到所述候选空间;所述矩阵共享层为所述深度神经网络模型中共享权重矩阵尺寸的层。

5、根据本专利技术提供的一种深度神经网络模型的剪枝方法,所述根据所述权重矩阵建立模型延迟查询表,包括:对所述深度神经网络模型的单层不同尺寸的权重矩阵进行推理延迟侧写,得到所述模型延迟查询表。

6、根据本专利技术提供的一种深度神经网络模型的剪枝方法,所述根据所述延迟查询表,基于离线阶段层内冗余筛除算法对所述候选空间进行层内修正,得到所述修正搜索空间,包括:根据所述延迟查询表和层内冗余筛除依据对所述候选空间进行层内修正,得到所述修正搜索空间;所述层内冗余筛除依据为预设块延迟阈值和/或预设块面积阈值。

7、根据本专利技术提供的一种深度神经网络模型的剪枝方法,所述在所述修正搜索空间,基于在线阶段进化算法对所述权重矩阵进行迭代块稀疏剪枝,包括:在所述修正搜索空间,将平均所述权重矩阵的重要度作为预设尺寸块的重要度;根据所述预设尺寸块的重要度,基于在线阶段进化算法,以延迟优先确定初始化候选块;迭代缩小所述候选块的尺寸进行迭代块稀疏剪枝。

8、本专利技术还提供一种深度神经网络模型的剪枝系统,包括:确定模块,用于确定所述深度神经网络模型的权重矩阵;离线模块,用于在稀疏计算平台上,基于离线阶段冗余筛除算法对所述权重矩阵的初步搜索空间进行修正,得到修正搜索空间;在线模块,用于在所述修正搜索空间,基于在线阶段进化算法对所述权重矩阵进行迭代块稀疏剪枝。

9、本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述深度神经网络模型的剪枝方法。

10、本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述深度神经网络模型的剪枝方法。

11、本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述深度神经网络模型的剪枝方法。

12、本专利技术提供的一种深度神经网络模型的剪枝方法及相关组件,该方法包括:确定深度神经网络模型的权重矩阵;在稀疏计算平台上,基于离线阶段冗余筛除算法对权重矩阵的初步搜索空间进行修正,得到修正搜索空间;在修正搜索空间,基于在线阶段进化算法对权重矩阵进行迭代块稀疏剪枝。块稀疏可以同时在精度、稀疏度以及计算效率中做权衡,本专利技术通过离线阶段冗余筛除算法缩小了块剪枝的搜索空间,结合在线阶段进化算法迭代调整块剪枝来平衡推理精度和速度。

本文档来自技高网...

【技术保护点】

1.一种深度神经网络模型的剪枝方法,其特征在于,包括:

2.根据权利要求1所述的深度神经网络模型的剪枝方法,其特征在于,所述在稀疏计算平台上,基于离线阶段冗余筛除算法对所述权重矩阵的初步搜索空间进行修正,得到修正搜索空间,包括:

3.根据权利要求2所述的深度神经网络模型的剪枝方法,其特征在于,所述基于离线阶段层间冗余筛除算法对所述权重矩阵对所述初步搜索空间进行层间修正,得到候选空间,包括:

4.根据权利要求2所述的深度神经网络模型的剪枝方法,其特征在于,所述根据所述权重矩阵建立模型延迟查询表,包括:

5.根据权利要求2所述的深度神经网络模型的剪枝方法,其特征在于,所述根据所述延迟查询表,基于离线阶段层内冗余筛除算法对所述候选空间进行层内修正,得到所述修正搜索空间,包括:

6.根据权利要求1至5任一项所述的深度神经网络模型的剪枝方法,其特征在于,所述在所述修正搜索空间,基于在线阶段进化算法对所述权重矩阵进行迭代块稀疏剪枝,包括:

7.一种深度神经网络模型的剪枝系统,其特征在于,包括:

8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述深度神经网络模型的剪枝方法。

9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述深度神经网络模型的剪枝方法。

10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述深度神经网络模型的剪枝方法。

...

【技术特征摘要】

1.一种深度神经网络模型的剪枝方法,其特征在于,包括:

2.根据权利要求1所述的深度神经网络模型的剪枝方法,其特征在于,所述在稀疏计算平台上,基于离线阶段冗余筛除算法对所述权重矩阵的初步搜索空间进行修正,得到修正搜索空间,包括:

3.根据权利要求2所述的深度神经网络模型的剪枝方法,其特征在于,所述基于离线阶段层间冗余筛除算法对所述权重矩阵对所述初步搜索空间进行层间修正,得到候选空间,包括:

4.根据权利要求2所述的深度神经网络模型的剪枝方法,其特征在于,所述根据所述权重矩阵建立模型延迟查询表,包括:

5.根据权利要求2所述的深度神经网络模型的剪枝方法,其特征在于,所述根据所述延迟查询表,基于离线阶段层内冗余筛除算法对所述候选空间进行层内修正,得到所述修正搜索空间,包括:

6....

【专利技术属性】
技术研发人员:刘云新耿瀚飞
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1