模型训练方法、对象处理方法及装置、电子设备、介质制造方法及图纸

技术编号：38627033 阅读：14 留言：0更新日期：2023-08-31 18:27

本公开实施例是关于一种模型训练方法、对象处理方法及装置、电子设备、存储介质，涉及计算机技术领域，该模型训练方法包括：获取原始模型；若所述原始模型收敛，对所述原始模型进行敏感度分析确定敏感度，并根据所述敏感度获取所述原始模型中每层的实际聚类数；根据所述每层的实际聚类数对各层的权值进行聚类以通过参数共享压缩原始模型，并基于聚类结果对压缩后的原始模型进行训练得到训练好的原始模型。本公开的技术方案在通过引入对原始模型各层的敏感度分析来计算每层的实际聚类数，能够准确地确定实际聚类数并对模型进行压缩，从而提高压缩后的模型的模型精度。提高压缩后的模型的模型精度。提高压缩后的模型的模型精度。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、对象处理方法及装置、电子设备、介质

[0001]本公开涉及计算机
，具体而言，涉及一种模型训练方法、模型训练装置、对象处理方法、对象处理装置、电子设备以及计算机可读存储介质。

技术介绍

[0002]神经网络算法在机器视觉、自动驾驶等领域中已被广泛应用于各种类型的任务，然而其复杂的结构导致即使在推理时也需占用大量的功耗和计算资源，严重影响了在功耗和资源受限的移动和嵌入式平台上的部署，因而需要对模型进行压缩。
[0003]相关技术中，可以对每层的所有权值进行聚类并训练所有层各聚类的中心值直至模型收敛，或者是对每层权重按照某种规则分为多个权值组再进行模型训练，也可以通过正则化训练压缩后的模型。
[0004]上述方式中，需要手动或者是凭经验全局设定每一层的聚类数，或者是根据压缩后的模型的精度来多次迭代调整每层的聚类数，因此难以平衡压缩率和精度。除此之外，每层的聚类数都是相同的，因此准确性较差且灵活性较差，具有一定的局限性。并且正则化需要修改训练代码，操作效率较低、计算机运算性能较低，且消耗了较多的计算资源。
[0005]需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开的目的在于提供一种模型训练方法、对象处理方法及装置、电子设备、存储介质，进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的模型压缩准确性较低的问题。
[0007]本公开的...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，包括：获取原始模型；若所述原始模型收敛，对所述原始模型进行敏感度分析确定敏感度，并根据所述敏感度获取所述原始模型中每层的实际聚类数；根据所述每层的实际聚类数对各层的权值进行聚类以通过参数共享压缩原始模型，并基于聚类结果对压缩后的原始模型进行训练得到训练好的原始模型。2.根据权利要求1所述的模型训练方法，其特征在于，所述对所述原始模型进行敏感度分析确定敏感度，并根据所述敏感度获取所述原始模型中每层的实际聚类数，包括：计算所述原始模型在数据集上的损失函数值，并通过所述原始模型的多个临时副本计算当前损失函数值；根据所述损失函数值以及所述当前损失函数值确定每层的敏感度；基于每层的所述敏感度确定所述原始模型中每层的所述实际聚类数。3.根据权利要求2所述的模型训练方法，其特征在于，通过所述原始模型的多个临时副本计算当前损失函数值，包括：在所述多个临时副本的第i个临时副本中对第i层的权值进行聚类确定聚类类型，将第i层的各原始位置确定为所属聚类类型的中心值并保持其他层的权值不变，以得到压缩后的第i个临时副本；将数据集前向通过所述压缩后的第i个临时副本，计算所述当前损失函数值。4.根据权利要求2所述的模型训练方法，其特征在于，所述基于每层的所述敏感度确定所述原始模型中每层的所述实际聚类数，包括：基于全局压缩率的条件约束，结合所述各层的敏感度与压缩率之间的关联关系，计算每层的所述实际聚类数。5.根据权利要求1所述的模型训练方法，其特征在于，所述对所述原始模型进行敏感度分析，并根据敏感度获取所述原始模型中每层的实际聚类数，包括：对所有临时副本的损失函数进行前向计算，得到各所述临时副本的当前损失函数值；将各所述当前损失函数值相对于所述损失函数值的增量，反向传播回各临时副本的在每层中的聚类数，得到下一迭代的各层的实际聚类数；根据下一迭代的各层的实际聚类数进行前向损失计算，直至各层的实际聚类数均收敛为止，以得到每层的实际聚类数。6.根据权利要求1所述的模型训练方法，其特征在于，所述基于聚类结果对压缩后的原始模型进行训练，得到训练好的原始模型，包括：计算对每个权值位的梯度，并对聚类结果中属于...

【专利技术属性】
技术研发人员：李文进，
申请(专利权)人：OPPO广东移动通信有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人