基于SokeTPU的模型压缩方法技术

技术编号：37525922 阅读：8 留言：0更新日期：2023-05-12 15:50

本发明专利技术公开了基于Soke TPU的模型压缩方法，包括以下步骤：步骤一，初始化网络；步骤二，稀疏训练；步骤三，模型压缩；步骤四，模型精度恢复；步骤五，模型转换及编译；步骤六，模型部署；所述步骤三中，模型压缩具体为：根据BN层权重直方图，将剪枝阈值调整为所有的BN层权重中最大值中的最小值之后，将所有的BN值从小到大排序，根据剪枝率n，将n个小于这个阈值的权重去掉；本发明专利技术基于Soke TPU对YOLOv5s模型进行基于通道的剪枝操作，通过对YOLOv5s模型的压缩，使其减少对Soke TPU的资源消耗，加速推理，更高效地利用Soke TPU的算力，使得处理同样的数据时，Soke TPU推理速度更快。TPU推理速度更快。TPU推理速度更快。

全部详细技术资料下载

【技术实现步骤摘要】
基于Soke TPU的模型压缩方法

[0001]本专利技术涉及计算机
，具体为基于Soke TPU的模型压缩方法。

技术介绍

[0002]近年来，随着万物互联时代的快速到来和无线网络的普及，网络边缘的设备数量和产生的数据都快速增长。在这种情形下，以云计算模型为核心的集中式处理模式将无法高效处理边缘设备产生的数据。集中式处理模型将所有数据通过网络传输到云计算中心，利用云计算中心超强的计算能力来集中式解决计算和存储问题，这使得云服务能够创造出较高的经济效益。但是在万物互联的背景下，传统云计算有四个不足：实时性不足，带宽不足，能耗较大，不利于数据安全和隐私。为了解决以上问题，面向边缘设备所产生海量数据计算的边缘计算模型应运而生。边缘计算是在网络边缘执行计算的一种新型计算模型，它具备低时延、低功耗、隐私性强的特点。而在大型的模型中，总是不可避免的存在大量的权重冗余，这种冗余甚至有可能降低模型的准确率。为了减少模型运行时对资源的消耗，并使模型能运行到更轻量级的边缘计算设备Soke TPU上，因此需要一种能够对模型进行压缩的方法。

技术实现思路

[0003]本专利技术的目的在于提供基于Soke TPU的模型压缩方法，以解决上述
技术介绍
中提出的问题。
[0004]为实现上述目的，本专利技术提供如下技术方案：基于Soke TPU的模型压缩方法，包括以下步骤：步骤一，初始化网络；步骤二，稀疏训练；步骤三，模型压缩；步骤四，模型精度恢复；步骤五，模型转换及编译；步骤六，模型部署；
[0005]其中在...

【技术保护点】

【技术特征摘要】
1.基于Soke TPU的模型压缩方法，包括以下步骤：步骤一，初始化网络；步骤二，稀疏训练；步骤三，模型压缩；步骤四，模型精度恢复；步骤五，模型转换及编译；步骤六，模型部署；其特征在于：其中在上述步骤一中，首先进行非稀疏训练，将得到的模型精度值作为一个基准值，使用自建的鸟类数据集作为训练集与验证集，并设置训练时的epoch，batch以及input size；其中在上述步骤二中，设置稀疏训练时的epoch，batch以及input size之后，再分别设置若干个稀疏率值，稀疏训练完成后查看各个稀疏率值对应的BN层权重直方图，选择稀疏训练效果最好的一个稀疏率值；其中在上述步骤三中，通过裁剪模型中卷积层的通道数，实现模型压缩；其中在上述步骤四中，完成步骤三的剪枝操作后，使用已经剪枝过的模型作为初始权重，进行Finetune恢复模型精度；其中在上述步骤五中，将步骤四中完成微调的模型进行格式转换，然后使用编译工具链进行编译；其中在上述步骤六中，...

【专利技术属性】
技术研发人员：朱博源，窦思远，杨冬立，
申请(专利权)人：广东松科智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人