【技术实现步骤摘要】
本专利技术属于视觉理解,更具体地,涉及一种用于分类任务的视觉理解模型的通道剪枝方法及应用。
技术介绍
1、近年来,深度学习技术在视觉理解领域展现出了强大的能力。然而,随着模型参数量的逐渐增长、网络深度不断增加,深度学习网络的推理对计算资源的消耗也迅速增长,对硬件性能提出了更高的要求。特别的,由于更多模型向智能手机与嵌入式设备上的部署,如果将消耗大量计算与存储成本的深度神经网络部署在资源受限的设备上是当前深度学习技术迈向更大规模应用的难点。为此,模型剪枝方法被提出,对各种视觉理解模型进行轻量化处理。其中,通道剪枝(也称滤波器剪枝)直接去除整个冗余通道的所有参数,其稀疏模式具有结构化特性,不需要特定硬件与算法库的支持,应用最为广泛。
2、模型剪枝旨在通过移除模型中冗余部分,同时尽量不影响模型预测精度。因此,如何识别模型中哪些部分是冗余的,成为剪枝方法关注的重点。当前主流方法是基于各通道的贡献度判断通道是否重要。该类方法假设具有较大参数幅值、较大特征图的值、或特征图秩更大的通道对输出具有更大的影响,因而更重要,冗余度更低。另外,还
...【技术保护点】
1.一种用于分类任务的视觉理解模型的通道剪枝方法,其特征在于,包括:
2.根据权利要求1所述的通道剪枝方法,其特征在于,所述视觉理解模型包括卷积层,和/或线性层,以及与卷积层,和/或线性层之后相邻的激活函数层和归一化层;
3.根据权利要求2所述的通道剪枝方法,其特征在于,采用数学期望和方差的估计值对应代替数学期望和方差
4.根据权利要求3所述的通道剪枝方法,其特征在于,所述激活函数f(x)为ReLU激活函数、ReLU6激活函数或tanh激活函数。
5.根据权利要求1-4任意一项所述的通道剪枝方法,其特征在于,所述已训练好
...【技术特征摘要】
1.一种用于分类任务的视觉理解模型的通道剪枝方法,其特征在于,包括:
2.根据权利要求1所述的通道剪枝方法,其特征在于,所述视觉理解模型包括卷积层,和/或线性层,以及与卷积层,和/或线性层之后相邻的激活函数层和归一化层;
3.根据权利要求2所述的通道剪枝方法,其特征在于,采用数学期望和方差的估计值对应代替数学期望和方差
4.根据权利要求3所述的通道剪枝方法,其特征在于,所述激活函数f(x)为relu激活函数、relu6激活函数或tanh激活函数。
5.根据权利要求1-4任意一项所述的通道剪枝方法,其特征在于,所述已训练好的视觉理解模型通过采用标准数据集对未训练的视觉理解模型进行训练得到;
6.一种用于分类任务的视觉理解模型压缩方法,其特征在于,包括:
7.一种...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。