一种神经网络实时结构化剪枝的方法和系统技术方案

技术编号：38196092 阅读：10 留言：0更新日期：2023-07-21 16:32

本发明专利技术公开了一种神经网络实时结构化剪枝的方法和系统，涉及人工智能技术领域。该方法包括：配置数据检测方案；计算本阶段输入数据并将计算结果写入存储单元；根据数据检测方案对计算结果进行检测，获得其数据特征；根据剪枝要求对数据特征进行判断，若数据特征满足剪枝要求，则对计算结果进行剪枝操作，且本阶段的该部分数据不参与后续运算；若数据特征不满足剪枝要求，则正常执行后续计算流程。本发明专利技术通过对输入数据进行实时结构化剪枝，降低了模型前向推理过程中的计算量，提高模型推理效率；本发明专利技术在数据写入存储单元的同时实现数据检测，不占用额外的数据访存时间；释放满足剪枝要求的数据所占的存储空间，减少推理过程中的运算空间需求。的运算空间需求。的运算空间需求。

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络实时结构化剪枝的方法和系统

[0001]本专利技术属于人工智能
，尤其涉及一种神经网络实时结构化剪枝的方法和系统。

技术介绍

[0002]神经网络模型在计算机视觉、语音识别等应用中发挥着重要作用。虽然神经网络模型是一种高效的数据处理方法，可以自动学习数据间的关联特征。但神经网络模型的参数量大、计算量大，在嵌入式终端设备上部署时，推理计算的实时性较差。由于神经网络模型具有一定的冗余性，因此在能够保证神经网络模型准确度的前提下，压缩网络模型成为目前研究的热点。
[0003]剪枝操作是模型压缩的重要内容，通过对神经网络模型进行剪枝操作，可以减少神经网络模型前向推理所需的参数量、计算量。剪枝操作分为非结构化剪枝和结构化剪枝。其中非结构化剪枝操作可以对网络模型的参数进行更加精细化的处理。然而目前大多数深度学习框架和硬件无法加速稀疏矩阵的计算，如果要跳过剪枝后的参数，还要设计相关的索引模块，大大增加模型执行的复杂度。所以非结构化剪枝在实际运算时对加快计算速率作用较小，甚至不如剪枝前的计算速率快。结构化剪枝模型在网络结构上与传统模型没有差异，可以得到现成深度学习库的支持。在跳过剪枝结构时，所要生成的中间表示也更加便捷。因此，结构化剪枝是目前应用较多的剪枝技术。
[0004]剪枝操作的本质，是通过减少或跳过对计算结果影响小的计算步骤，从而达到减少计算量、加速模型计算的效果。由于计算结果是由输入数据和模型参数共同决定的，传统的剪枝操作主要为针对模型参数进行的剪枝处理，而针对输入数据的剪枝研究工作较少。...

【技术保护点】

【技术特征摘要】
1.一种神经网络实时结构化剪枝的方法，其特征在于：将所述神经网络的算法过程拆解为若干阶段，所述方法包括如下步骤：S101，配置数据检测方案；S102，计算本阶段输入数据并将计算结果写入存储单元；S103，根据所述数据检测方案对所述计算结果进行检测，并获得其数据特征；S104，判断所述数据特征是否满足剪枝要求，若满足，则对所述计算结果进行剪枝操作；否则，将所述计算结果作为后续阶段输入数据，并执行步骤S105；S105，重复执行步骤S101～步骤S104；其中，所述步骤S102和步骤S103同时进行。2.根据权利要求1所述的一种神经网络实时结构化剪枝的方法，其特征在于：在所述算法过程的不同阶段采用相同或不同的数据检测方案。3.根据权利要求1所述的一种神经网络实时结构化剪枝的方法，其特征在于：计算单元从所述存储单元中读取本阶段的待计算数据，并将其作为所述本阶段输入数据进行计算。4.根据权利要求1所述的一种神经网络实时结构化剪枝的方法，其特征在于：所述数据检测方案包括方案一和方案二，根据模型精度的损失程度选择所述数据检测方案；其中，所述方案一为：检测所述计算结果是否全部为0；所述方案二为：检测所述计算结果的所述数据特征是否超过阈值，所述阈值包括第一阈值和第二阈值。5.根据权利要求4所述的一种神经网络实时结构化剪枝的方法，其特征在于：所述数据特征包括：非0值的...

【专利技术属性】
技术研发人员：杨清海，尹泽芃，
申请(专利权)人：西安电子科技大学广州研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人