【技术实现步骤摘要】
深度学习模型的压缩方法、装置、设备及存储介质
本专利技术涉及计算机
,尤其涉及一种深度学习模型的压缩方法、装置、设备及存储介质。
技术介绍
深度学习模型是指已经训练完成的神经网络,网络里含有大量的参数,以记录训练数据的特征信息。目前,由于深度学习模型中含有大量的节点和参数,使得最终训练完成的模型需要消耗巨大的内存和计算代价;为此,人们一般会对模型进行剪枝处理,以剔除模型中不重要的参数来减少模型的冗余,进而提高运算速率,并减小模型体积。然而,对模型进行剪枝处理,可能会对模型的预测效果产生影响。
技术实现思路
本申请提供一种深度学习模型的压缩方法、装置、设备及存储介质,不仅能够提升运算速率,减小模型体积,且不会对模型的预测效果产生影响。为解决上述技术问题,本申请采用的第一个技术方案是:一种深度学习模型的压缩方法,该压缩方法包括:将预先训练完成的初始深度学习模型中部分图节点的原始格式修改为预设格式;将格式为所述预设格式的图节点的数据类型由浮点型数据转换成整型数据,以 ...
【技术保护点】
1.一种深度学习模型的压缩方法,其特征在于,包括:/n将预先训练完成的初始深度学习模型中部分图节点的原始格式修改为预设格式;/n将格式为所述预设格式的图节点的数据类型由浮点型数据转换成整型数据,以压缩所述初始深度学习模型。/n
【技术特征摘要】
1.一种深度学习模型的压缩方法,其特征在于,包括:
将预先训练完成的初始深度学习模型中部分图节点的原始格式修改为预设格式;
将格式为所述预设格式的图节点的数据类型由浮点型数据转换成整型数据,以压缩所述初始深度学习模型。
2.根据权利要求1所述的深度学习模型的压缩方法,其特征在于,所述将预先训练完成的初始深度学习模型中部分图节点的原始格式修改为预设格式的步骤之前,还包括:
获取预先训练的深度学习模型;
对所述深度学习模型进行剪枝训练处理以得到所述初始深度学习模型。
3.根据权利要求1所述的深度学习模型的压缩方法,其特征在于,所述将格式为所述预设格式的图节点的数据类型由浮点型数据转换成整型数据,以压缩所述初始深度学习模型的步骤具体包括:
依次遍历格式为所述预设格式的图节点;
判断当前遍历的所述图节点的浮点型数据是否支持转换成整型数据;
若支持,将所述图节点的数据类型由浮点型数据转换成整型数据;
若不支持,保持所述图节点的数据类型为浮点型数据。
4.根据权利要求3所述的深度学习模型的压缩方法,其特征在于,所述将所述图节点数据类型由浮点型数据转换成整型数据的步骤,包括:
接收当前所述图节点的输入值;
判断所述输入值小数点之后的数值是否为零;
若是,则直接将所述图节点的浮点型数据转换成整型数据;
若否,则将所述输入值扩大第一预设倍数之后,将所述图节点的浮点型数据转换成整型数据。
5.根据权利要求3所述的深度学习模型的压缩方法,其特征在于,当所述当...
【专利技术属性】
技术研发人员:黄磊,杨春勇,靳丁南,权圣,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。