一种模型压缩方法、系统及存储介质技术方案

技术编号:38894310 阅读:35 留言:0更新日期:2023-09-22 14:17
本申请公开一种模型压缩方法、系统及存储介质,涉及模型压缩技术领域,能够提高模型压缩效率。具体方案包括:服务器接收客户端发送的可执行文件,可执行文件中包括:接口文件、调用文件、待压缩模型和待压缩模型的运行环境程序;接口文件用于获取训练数据集、验证数据集、损失函数和优化器;调用文件用于调用目标压缩程序;服务器确定待压缩模型的初始模型精度;服务器利用调用文件获取目标压缩程序,并利用目标压缩程序、损失函数和优化器对待压缩程序进行压缩,得到压缩模型;服务器确定压缩模型的压缩模型精度,若初始模型精度和压缩模型精度的精度差的绝对值小于预设阈值,则得到待压缩模型的目标压缩模型,并将目标压缩模型发送至客户端。至客户端。至客户端。

【技术实现步骤摘要】
一种模型压缩方法、系统及存储介质


[0001]本申请涉及模型压缩
,尤其涉及一种模型压缩方法、系统及存储介质。

技术介绍

[0002]深度学习在计算机视觉、自然语言处理、语音识别等领域中已经取得了很多重要的成果。但是,在实际应用中,由于深度学习模型的参数量和计算量大,导致模型在部署时需要消耗大量的计算资源和存储空间。如果没有考虑到这个因素,不仅会导致模型在移动设备等较弱计算能力的设备上无法实时运行,也会影响云端部署的成本和效率。模型压缩通过减少模型的参数量和计算量,以达到在保持模型性能的同时降低计算资源和存储空间需求的目的。
[0003]目前的模型压缩方法有剪枝、蒸馏、量化等。但对于大部分压缩方法,压缩后需要进行模型参数的微调,需要进行少量步骤的重新训练。不同的用户模型可能需要不同的环境,传统的模型压缩方法在不同的环境可能存在不同的兼容性问题,这可能导致应用程序在某些环境下无法运行或者出现错误,导致模型压缩效率和压缩后模型的精度较低。

技术实现思路

[0004]本申请提供一种模型压缩方法、系统及存储介质,能够提高模本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种模型压缩方法,其特征在于,所述方法包括:服务器接收客户端发送的可执行文件,所述可执行文件中包括:接口文件、调用文件、待压缩模型和所述待压缩模型的运行环境程序;其中,所述接口文件用于获取所述待压缩模型的训练数据集、验证数据集、损失函数和优化器;所述调用文件用于调用目标压缩程序,所述目标压缩程序用于压缩所述待压缩模型;所述运行环境程序为运行所述待压缩模型的关联程序;服务器确定所述待压缩模型的初始模型精度;服务器利用所述调用文件获取所述目标压缩程序,并利用所述目标压缩程序、所述损失函数和所述优化器对所述待压缩模型进行压缩,得到压缩模型;服务器确定所述压缩模型的压缩模型精度,若所述初始模型精度和所述压缩模型精度的精度差的绝对值小于预设阈值,则得到所述待压缩模型的目标压缩模型,并将所述目标压缩模型发送至所述客户端。2.根据权利要求1所述的方法,其特征在于,所述服务器接收客户端发送的可执行文件之前,所述方法还包括:客户端配置接口文件,所述接口文件中包括第一调用函数、第二调用函数、所述损失函数和所述优化器;所述第一调用函数用于根据所述训练数据集的第一存储路径获取所述训练数据集;所述第二调用函数用于根据所述验证数据集的第二存储路径获取所述验证数据集。3.根据权利要求2所述的方法,其特征在于,所述客户端配置所述接口文件之后,所述方法还包括:客户端获取所述待压缩模型的模型定义文件,根据所述模型定义文件获取所述运行环境程序;客户端利用预设的打包程序,对所述接口文件、所述待压缩模型和所述调用文件和所述运行环境程序进行打包处理,得到所述可执行文件。4.根据权利要求3所述的方法,其特征在于,所述服务器确定所述压缩模型的压缩模型精度之后,所述方法还包括:若所述初始模型精度和所述压缩模型精度的精度差的绝对值大于预设阈值,则服务器利用所述训练数据集和所述验证数据集对所述压缩模型进行训练,得到更新压缩模型;服务器确定所述更新压缩模型的更新压缩模型精度,若所述初始模型精度和所述更新压缩模型精度的精度差的绝对值小于预设阈值,则将所述更新压缩模型作为所述目标压缩模型...

【专利技术属性】
技术研发人员:冯珺赵帅潘司晨彭梁英毛冬王红凯柯公武
申请(专利权)人:国网浙江省电力有限公司双创中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1