基于深度学习的模型压缩训练的方法、装置和设备制造方法及图纸

技术编号：38193074 阅读：7 留言：0更新日期：2023-07-20 21:12

本申请提供一种基于深度学习的模型压缩训练的方法、装置和设备。该方法包括：在对深度学习模型进行训练的迭代过程中，当运行至目标算子时，获取目标算子的输入数据，目标算子为数据待压缩的算子；从映射关系存储文件中获取与目标算子对应的压缩参数，其中，映射关系存储文件中包括与每一目标算子对应的压缩参数；基于与目标算子对应的压缩参数，对目标算子的输入数据进行压缩，以得到压缩数据；根据压缩数据对深度学习模型进行训练。本申请的方法，有助于加快模型训练速度，同时减少计算资源消耗。耗。耗。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的模型压缩训练的方法、装置和设备

[0001]本申请涉及深度学习技术和人工智能领域，尤其涉及一种基于深度学习的模型压缩训练的方法、装置和设备。

技术介绍

[0002]随着人工智能技术的发展，深度学习模型广泛应用于图像处理、自然语言处理等领域。深度学习需要用到大量的神经网络和运算模块，基于这个需求目前有很多深度学习框架，例如PyTorch、Caffe、MXNet和TensorFlow等。深度学习框架通常是基于计算图设计的，计算图可分为静态计算图和动态计算图。静态图指先定义再运行，一次定义多次运行。动态图是在运行过程中被定义的，在运行的时候构建，可以多次构建多次运行。基于这样的功能设计思路，运算模块对应图中的一个节点，图中包含多个运算节点。由于动态图的思想直观明了，更符合人的思考过程，使用动态图设计深度学习模型的研究越来越多。
[0003]深度学习模型的压缩是指利用神经网络参数的冗余性和网络结构的冗余性来精简模型，在不影响任务完成度的情况下，得到参数量更少、结构更精简的模型。被压缩后的模型对于计算资源和内存的需求更小，相比原始未压缩的模型能够满足更加广泛的应用需求。
[0004]目前，在基于深度学习的模型压缩训练过程中，当运行至可以实现数据压缩的算子时，算子内部需要完成根据输入数据计算压缩参数，然后通过计算获得的压缩参数对输入数据进行压缩处理，数据被压缩处理之后再进行算子计算以输出结果。
[0005]在模型训练的迭代过程中，每一次迭代过程中都需要计算一次压缩参数，导致模型训练的速度较慢...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的模型压缩训练的方法，其特征在于，所述深度学习模型包括多个算子，所述方法包括：在对深度学习模型进行训练的迭代过程中，当运行至目标算子时，获取所述目标算子的输入数据，所述目标算子为数据待压缩的算子；从映射关系存储文件中获取与所述目标算子对应的压缩参数，其中，所述映射关系存储文件中包括与每一目标算子对应的压缩参数；基于与所述目标算子对应的压缩参数，对所述目标算子的输入数据进行压缩，以得到压缩数据；根据所述压缩数据对所述深度学习模型进行训练。2.根据权利要求1所述的方法，其特征在于，从映射关系存储文件中获取与所述目标算子对应的压缩参数，包括：以所述目标算子的算子标识符为键值在映射关系存储文件中进行映射，获得与所述目标算子的算子标识符对应的压缩参数，作为与所述目标算子对应的压缩参数。3.根据权利要求1所述的方法，其特征在于，基于与所述目标算子对应的压缩参数，对所述目标算子的输入数据进行压缩，以得到压缩数据，包括：若基于预设策略确定与所述目标算子对应的压缩参数无需更新，则根据与所述目标算子对应的压缩参数，对所述目标算子的输入数据进行压缩，以得到压缩数据；若基于预设策略确定与所述目标算子对应的压缩参数需要更新，则根据所述目标算子的输入数据计算新的压缩参数，根据所述新的压缩参数，对所述目标算子的输入数据进行压缩，以得到压缩数据。4.根据权利要求3所述的方法，其特征在于，在根据所述目标算子的输入数据计算新的压缩参数之后，还包括：将所述映射关系存储文件中与所述目标算子对应的压缩参数，更新为所述新的压缩参数。5.根据权利要求3所述的方法，其特征在于，所述预设策略为所述目标算子的输入数据经过与所述目标算子对应的压缩参数的压缩之后得到的数据范围，是否在预设范围之内；基于预设策略确定与所述目标算子对应的压缩参数无需更新，包括：若所述数据范围在所述预设范围之内，则确定与所述目标算子对应的压缩参数无需更新；基于预设策略确定与所述目标算子对应的压缩参数需要更新，包括：若所述数据范围不在所述预设范围之内，则确定与所述目标算子对应的压缩参数需要更新。6.根据权利要求3所述的方法，其特征在于，在若基于预设策略确定与所述目标算子对应的压缩参数无需更新之前，还包括：在确定达到预设的更新间隔次数时，基于预设策略确定与所述目标算子对应的压缩参数是否需要更新。7.根据权利要求6...

【专利技术属性】
技术研发人员：请求不公布姓名，
申请(专利权)人：上海寒武纪信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人