一种基于设备参数的模型处理方法及电子设备技术

技术编号:29052830 阅读:11 留言:0更新日期:2021-06-26 06:19
本申请公开了一种基于设备参数的模型处理方法及电子设备,用以将深度学习模型部署在资源受限的设备。方法包括:解析目标设备的空间容量和待安装的目标模型所需的空间容量,目标模型包括至少一个卷积层;在目标设备的空间容量不满足目标模型所需的空间容量的情况下,基于目标设备的空间容量确定目标模型的压缩比率;基于压缩比率缩限目标模型中符合预设条件的卷积层的结构,以实现对目标模型的压缩;将压缩后的模型安装到目标设备中。采用本申请所提供的方案,实现了将深度学习模型部署在资源受限的设备的目的。源受限的设备的目的。源受限的设备的目的。

【技术实现步骤摘要】
一种基于设备参数的模型处理方法及电子设备


[0001]本申请涉及人工智能领域,特别涉及一种基于设备参数的模型处理方法及电子设备。

技术介绍

[0002]“边缘智能”是指将人工智能应用在边缘设备,以使人工智能能够普及到普通用户的真实生活中,但边缘设备(如移动手机的Face ID、无人机、去中心化自动驾驶系统等)的计算和存储等资源有限,且随着人工智能领域对机器智能化需求的提高,神经网络的结构设计得愈加复杂,所需的计算量和存储空间也随之大大增加,这使得深度神经网络难以在边缘设备上部署,因此,目前的神经网络依然没有深度应用在普通用户层面,如何将深度学习模型部署在资源受限的边缘设备,是亟需解决的技术问题。

技术实现思路

[0003]本申请提供了一种基于设备参数的模型处理方法,包括:
[0004]解析目标设备的空间容量和待安装的目标模型所需的空间容量,所述目标模型包括至少一个卷积层;
[0005]在所述目标设备的空间容量不满足所述目标模型所需的空间容量的情况下,基于所述目标设备的空间容量确定所述目标模型的压缩比率;
[0006]基于所述压缩比率缩限所述目标模型中符合预设条件的卷积层的结构,以实现对所述目标模型的压缩;
[0007]将压缩后的模型安装到所述目标设备中。
[0008]在一个实施例中,基于所述压缩比率缩限所述目标模型中符合预设条件的卷积层的结构,包括:
[0009]提取所述目标模型中位于同一卷积层的卷积滤波器;
[0010]确定卷积滤波器的相似度参数;
[0011]根据所述相似度参数选取所述卷积层中符合预设条件的卷积滤波器;
[0012]对所述卷积层中符合预设条件的卷积滤波器进行删除操作,以实现对所述目标模型中卷积层的压缩。
[0013]在一个实施例中,所述确定卷积滤波器的相似度参数,包括:
[0014]确定同一卷积层的所有卷积滤波器对应的向量;
[0015]确定每个卷积滤波器对应的向量与同一层的所有卷积滤波器对应的向量之间的相似度;
[0016]将每个滤波器对应的向量与同一层的所有卷积滤波器对应的向量之间的相似度进行加权求和;
[0017]确定进行所述加权求和所得到的和值为每个滤波器对应的相似度参数。
[0018]在一个实施例中,所述确定每个卷积滤波器对应的向量与同一层的所有卷积滤波
器对应的向量之间的相似度,包括:
[0019]根据每个卷积滤波器对应的向量与同一层的所有卷积滤波器对应的向量之间的夹角和向量长度计算每个卷积滤波器对应的向量与同一层的所有卷积滤波器对应的向量之间的相似度;
[0020]其中,向量之间的夹角大于预设角度时,相似度取负值;向量之间的夹角小于预设角度时,相似度取正值。
[0021]在一个实施例中,将每个卷积滤波器对应的向量与同一层的所有卷积滤波器对应的向量之间的相似度进行加权求和,包括:
[0022]确定位于同一卷积层的卷积滤波器所对应的相似度矩阵,其中,所述相似度矩阵中的每个元素用于表征相应卷积滤波器对应的向量与同一层所有卷积滤波器对应向量之间的相似度值;
[0023]从所述相似度矩阵提取所有相似度值,并为每一个相似度值赋予权重,其中,相似度值为正值则赋予第一权重,相似度值为负值则赋予第二权重,所述第一权重大于第二权重;
[0024]将赋予权重之后的相似度进行求和计算。
[0025]在一个实施例中,根据所述相似度参数选取所述卷积层中符合预设条件的卷积滤波器,包括:
[0026]根据相似度参数从大到小的顺序对所述同一卷积层的卷积滤波器进行排序,以形成排序后的卷积滤波器队列;
[0027]从排序后的卷积滤波器队列中选取排序位置符合预设位置的卷积滤波器作为符合预设条件的卷积滤波器。
[0028]在一个实施例中,根据所述相似度参数选取所述卷积层中符合预设条件的卷积滤波器,包括:
[0029]确定相似度参数位于预设区间的的卷积滤波器为符合预设条件的卷积滤波器。
[0030]在一个实施例中,所述目标设备的空间容量通过以下方式获取:
[0031]获取所述目标模型的属性参数;
[0032]根据所述属性参数确定所述目标模型所需的空间容量,其中,所述目标模型所需空间容量至少包括安装所述目标模型所需的存储空间容量和缓存空间容量;
[0033]所述目标设备的空间容量通过以下方式获取:
[0034]获取所述目标设备对应的配置参数表;
[0035]从所述配置参数表中获取所述目标设备的空间容量,所述目标设备的空间容量至少包括所述目标设备的存储空间容量和缓存空间容量。
[0036]在一个实施例中,所述基于所述目标设备的空间容量确定所述目标模型的压缩比率,包括:
[0037]根据所述目标模型所需的存储空间和所述目标设备的存储空间容量确定第一比率;
[0038]根据所述目标模型所需的缓存空间和所述目标设备的缓存空间容量确定第二比率;
[0039]确定所述第一比率和第二比率二者的最大值为所述目标模型的压缩比率。
[0040]本申请还提供一种电子设备,包括:
[0041]解析模块,用于解析目标设备的空间容量和待安装的目标模型所需的空间容量,所述目标模型包括至少一个卷积层;
[0042]确定模块,用于在所述目标设备的空间容量不满足所述目标模型所需的空间容量的情况下,基于所述目标设备的空间容量确定所述目标模型的压缩比率;
[0043]缩限模块,用于基于所述压缩比率缩限所述目标模型中符合预设条件的卷积层的结构,以实现对所述目标模型的压缩;
[0044]安装模块,用于将压缩后的模型安装到所述目标设备中。
[0045]本申请还提供一种电子设备,包括:
[0046]处理器;
[0047]用于存储所述处理器中可执行指令的存储器;
[0048]其中,所述处理器被配置为执行上述任一实施例所提供的基于设备参数的模型处理方法。
[0049]在安装目标模型的设备的空间容量不满足目标模型所需的空间容量的情况下,基于设备参数自动确定目标模型的压缩比率,并基于该压缩比率对目标模型进行压缩;使得压缩后的模型能够适配目标设备的空间容量,从而实现了将深度学习模型部署在资源受限的设备的目的。
附图说明
[0050]图1为本申请一实施例中一种基于设备参数的模型处理方法的流程图;
[0051]图2为本申请另一实施例中一种基于设备参数的模型处理方法的流程图;
[0052]图3为本申请一实施例中一种电子设备的框图;
[0053]图4为本申请另一实施例中一种电子设备的框图。
具体实施方式
[0054]此处参考附图描述本申请的各种方案以及特征。
[0055]应理解的是,可以对此处申请的实施例做出各种修改。因此,上述说明书不应该视为限制,而仅是作为实施例的范例。本领本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于设备参数的模型处理方法,包括:解析目标设备的空间容量和待安装的目标模型所需的空间容量,所述目标模型包括至少一个卷积层;在所述目标设备的空间容量不满足所述目标模型所需的空间容量的情况下,基于所述目标设备的空间容量确定所述目标模型的压缩比率;基于所述压缩比率缩限所述目标模型中符合预设条件的卷积层的结构,以实现对所述目标模型的压缩;将压缩后的模型安装到所述目标设备中。2.如权利要求1所述的方法,基于所述压缩比率缩限所述目标模型中符合预设条件的卷积层的结构,包括:提取所述目标模型中位于同一卷积层的卷积滤波器;确定卷积滤波器的相似度参数;根据所述相似度参数选取所述卷积层中符合预设条件的卷积滤波器;对所述卷积层中符合预设条件的卷积滤波器进行删除操作,以实现对所述目标模型中卷积层的压缩。3.如权利要求2所述的方法,所述确定卷积滤波器的相似度参数,包括:确定同一卷积层的所有卷积滤波器对应的向量;确定每个卷积滤波器对应的向量与同一层的所有卷积滤波器对应的向量之间的相似度;将每个滤波器对应的向量与同一层的所有卷积滤波器对应的向量之间的相似度进行加权求和;确定进行所述加权求和所得到的和值为每个滤波器对应的相似度参数。4.如权利要求3所述的方法,所述确定每个卷积滤波器对应的向量与同一层的所有卷积滤波器对应的向量之间的相似度,包括:根据每个卷积滤波器对应的向量与同一层的所有卷积滤波器对应的向量之间的夹角和向量长度计算每个卷积滤波器对应的向量与同一层的所有卷积滤波器对应的向量之间的相似度;其中,向量之间的夹角大于预设角度时,相似度取负值;向量之间的夹角小于预设角度时,相似度取正值。5.如权利要求3所述的方法,将每个卷积滤波器对应的向量与同一层的所有卷积滤波器对应的向量之间的相似度进行加权求和,包括:确定位于同一卷积层的卷积滤波器所对应的相似度矩阵,其中,所述相似度矩阵中的每个元素用于表征相应卷积滤波器对应的向量与同一层所有卷积滤波器对应向量之间的相似度值;从所述相似度矩阵提取所有相似度值,并为每一个相似度值赋予权重,其中...

【专利技术属性】
技术研发人员:舒红乔王奇刚李远辉
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1