轻量化模型部署方法及装置、介质、设备制造方法及图纸

技术编号:38324073 阅读:14 留言:0更新日期:2023-07-29 09:06
本发明专利技术提供一种轻量化模型部署方法及装置、介质、设备。方法包括:设置轻量化模型;初始化所述轻量化模型的网络参数,并根据训练数据集对所述轻量化模型进行训练;在训练完成后,计算每一个输出通道的重要性得分,并删除重要性得分低于预设得分的输出通道,得到剪枝处理后的轻量化模型;将剪枝处理后的轻量化模型部署至嵌入式设备中。本发明专利技术实施例通过对轻量化模型进一步剪枝处理,实现模型的进一步压缩,得到更为轻量化的模型,因此在部署到嵌入式设备中时,不会受到存储大小和计算成本的硬件限制。制。制。

【技术实现步骤摘要】
轻量化模型部署方法及装置、介质、设备


[0001]本专利技术涉及模型训练
,尤其是涉及一种轻量化模型部署方法及装置、介质、设备。

技术介绍

[0002]目前随着人工智能、物联网技术的发展,越来越多的新兴技术应用于传统的行业。在这种全新的技术背景下,政府服务的发展也离不开这些技术的支撑。政务大厅是一个政府机构提供服务的场所,目前政务大厅往往人员和业务十分繁忙,给管理和服务带来了很大的挑战。为了提高政务大厅的效率和服务质量,可以将物联网这些新兴的技术结合人工智能应用于政务大厅,进而提供更高效、更智能的服务。
[0003]具体来说,可以在政务大厅内部设置智能温控系统,实现温度、湿度等环境参数的自动监测和控制,从而提供更加舒适、健康的服务环境。还可以将物联网技术结合深度学习中的图像技术,实现智能安防监控,帮助政务大厅更好地保障工作人员和市民的安全。通过人脸识别、身份认证等技术简化服务流程,通过检测老年人提高服务效率和质量。但是目前物联网技术需要的嵌入式设备的部署受到存储大小和计算成本的硬件限制。

技术实现思路

[0004]针对以上至少一个技术问题,本专利技术实施例提供一种轻量化模型部署方法及装置、介质、设备。
[0005]根据第一方面,本专利技术实施例提供的轻量化模型部署方法,包括:
[0006]设置轻量化模型;
[0007]初始化所述轻量化模型的网络参数,并根据训练数据集对所述轻量化模型进行训练;
[0008]在训练完成后,计算每一个输出通道的重要性得分,并删除重要性得分低于预设得分的输出通道,得到剪枝处理后的轻量化模型;
[0009]将剪枝处理后的轻量化模型部署至嵌入式设备中。
[0010]根据第二方面,本专利技术实施例提供的轻量化模型部署装置,包括:
[0011]模型设置模块,用于设置轻量化模型;
[0012]模型训练模块,用于初始化所述轻量化模型的网络参数,并根据训练数据集对所述轻量化模型进行训练;
[0013]剪枝处理模块,用于在训练完成后,计算每一个输出通道的重要性得分,并删除重要性得分低于预设得分的输出通道,得到剪枝处理后的轻量化模型;
[0014]模型部署模块,用于将剪枝处理后的轻量化模型部署至嵌入式设备中。
[0015]根据第三方面,本专利技术实施例提供计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行实现第一方面提供的方法。
[0016]根据第四方面,本专利技术实施例提供的计算设备,包括存储器和处理器,所述存储器
中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面提供的方法。
[0017]本专利技术实施例提供的轻量化模型部署方法及装置、介质、设备,首先设置轻量化模型,然后初始化所述轻量化模型的网络参数,并根据训练数据集对所述轻量化模型进行训练;在训练完成后,计算每一个输出通道的重要性得分,并删除重要性得分低于预设得分的输出通道,得到剪枝处理后的轻量化模型;将剪枝处理后的轻量化模型部署至嵌入式设备中。可见本专利技术实施例通过对轻量化模型进一步剪枝处理,实现模型的进一步压缩,得到更为轻量化的模型,因此在部署到嵌入式设备中时,不会受到存储大小和计算成本的硬件限制。
附图说明
[0018]图1为本专利技术一实施例中轻量化模型部署方法的流程示意图;
[0019]图2为本专利技术一实施例中轻量化模型部署方法的流程示意图。
具体实施方式
[0020]第一方面,本专利技术实施例提供一种轻量化模型部署方法,参见图1~2,该方法包括如下步骤S110~S140:
[0021]S110、设置轻量化模型;
[0022]在一个实施例中,可以根据移动网络模型和图像任务网络模型,设置所述轻量化模型。
[0023]例如,移动网络模型选择用于移动网络的MobileNet系列的模型,图像任务网络模型选择目标检测模型SSD。
[0024]具体的,可以将SSD网络结构中的主干网络VGG16结构替换为MobileOne

S0结构,MobileOne

S0结构包括除了平均池化层之外的6个阶层,并将SSD网络结构中的四个额外层替换为4个深度可分离卷积层;其中,所述SSD网络结构为单次发射多盒探测器的目标检测网络结构,VGG16结构为16层的图像分类模型VGG,MobileOne

S0结构为MobileOne的S0版本,MobileOne为一个移动端主干网络模型。
[0025]也就是说,这里设计的轻量化模型以MobileOne和SSD结合举例。SSD网络结构主要由VGG16结构作为主干网络,再加上4个额外的卷积层。其中,分类和回归预测总共提取SSD网络结构中的6层。浅层特征图用于提取小目标,而深层的特征图则用于提取较大的目标。首先我们将整个主干网络VGG16替换为MobileOne

S0结构。MobileOne

S0中stage7为平均池化层,所以我们只截取到前面的stage6为止。另外,额外的4个卷积层也替换为4个深度可分离卷积。
[0026]此外,由于SSD网络结构是应用于边缘端的目标检测任务,所以摄像头检测的对象都是一些大目标。针对这个网络的特殊性,分类和回归预测提取的6层中,可以取消38*38的特征输出图,改由19*19作为特征输出层的第一层。再将MobileOne

S0中stage6的通道由512改为1024。
[0027]S120、初始化所述轻量化模型的网络参数,并根据训练数据集对所述轻量化模型进行训练;
[0028]在一个实施例中,所述初始化所述轻量化模型的网络参数,可以包括:初始化训练
的迭代次数、批次大小、权重衰减系数、随机梯度下降的动量、初始学习率和调整学习率的方式中的至少一项。
[0029]例如,初始化具体可以包括:批次大小为32,权重衰减系数为0.0001,随机梯度下降的动量设置为0.9,初始学习率设置为0.01,使用余弦退火来调整学习率,训练迭代轮次为700轮。
[0030]在初始化完成后,可以根据训练数据集进行模型训练。例如,轻量化模型的作用是对老人进行检测,训练数据集则是针对老年人检测的数据集。
[0031]S130、在训练完成后,计算每一个输出通道的重要性得分,并删除重要性得分低于预设得分的输出通道,得到剪枝处理后的轻量化模型;
[0032]在一个实施例中,S130可以具体包括:
[0033]S131、计算每一个输出通道的信息熵和信息独立度;
[0034]S132、将每一个输出通道的信息熵和信息独立度进行加权融合,得到该输出通道的重要性得分。
[0035]假设整个轻量化模型一共多个卷积层,第j个卷积层的卷积核的数量为n
j
,输出通道的数量为n
j+1
,那么第j个卷积层的参数共有n
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种轻量化模型部署方法,其特征在于,包括:设置轻量化模型;初始化所述轻量化模型的网络参数,并根据训练数据集对所述轻量化模型进行训练;在训练完成后,计算每一个输出通道的重要性得分,并删除重要性得分低于预设得分的输出通道,得到剪枝处理后的轻量化模型;将剪枝处理后的轻量化模型部署至嵌入式设备中。2.根据权利要求1所述的方法,其特征在于,所述计算每一个输出通道的重要性得分,包括:计算每一个输出通道的信息熵和信息独立度;将每一个输出通道的信息熵和信息独立度进行加权融合,得到该输出通道的重要性得分。3.根据权利要求2所述的方法,其特征在于,采用如下计算式计算第i个输出通道的信息熵:息熵:息熵:其中,M
ent
(x
i
)为第i个输出通道的信息熵,x
i
为第i个输出通道的信息量,n
j
为所述轻量化模型中第j个卷积层中第i个输出通道的卷积核的数量,m为所述轻量化模型中第j个卷积层中第i个输出通道中的卷积核的编号,P(x
i,m
)为第i个输出通道中第m个卷积核的信息量的发生概率,x
i,m
为第i个输出通道的第m个卷积核的信息量,w
m
为第m个卷积核的参数,w
l
为第l个卷积核的参数,l=1、2
……
n
j
,||||2为欧式距离的计算符号。4.根据权利要求2所述的方法,其特征在于,采用如下计算式计算第i个输出通道的信息独立度:其中,M
ind
(x
i
)为第i个输出通道的信息独立度,x
i
为第i个输出通道的信息量,W
i
为第i个输出通道的参数,W
p
为第p个输出通道的参数,p=1、2、
……
、n
j+1
,n
j+1
为轻量化模型中第j个卷积层中输出通道的数量,||||2为欧式距离的计算符号。5.根据权利要求2所述的方法,其特征在于,采用如下计算式计算第i个输出通道的重要性得分:M(x
i<...

【专利技术属性】
技术研发人员:宋晨段强姜凯李锐
申请(专利权)人:山东浪潮科学研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1