知识蒸馏的对抗式蒸馏温度调整方法、装置、设备及介质制造方法及图纸

技术编号：38730128 阅读：13 留言：0更新日期：2023-09-08 23:20

本发明专利技术涉及人工智能、机器学习、智慧医疗、金融科技技术领域，公开了一种知识蒸馏的对抗式蒸馏温度调整方法、装置、设备及介质。本方法通过梯度下降算法迭代学生模型中的全体参数使得目标损失函数的值最小，确定最小损失值；通过梯度上升算法迭代温度参数使得目标损失函数的值最大，确定最大损失值；交替执行上述迭代过程，使得所述最大损失值与所述最小损失值之间差值的绝对值小于预设阈值。确定出当前蒸馏温度。由此提高了学生模型学习的效率，同时符合由易到难的学习过程，缓解了固定温度超参数带来的模型性能瓶颈问题。参数带来的模型性能瓶颈问题。参数带来的模型性能瓶颈问题。

全部详细技术资料下载

【技术实现步骤摘要】
知识蒸馏的对抗式蒸馏温度调整方法、装置、设备及介质

[0001]本专利技术涉及人工智能、深度学习、智慧医疗、金融科技
，尤其涉及一种知识蒸馏的对抗式蒸馏温度调整方法、装置、设备及介质。

技术介绍

[0002]随着人工智能和深度学习技术的发展，深度学习通过从数据中自行学习出有效的特征表示，代替以往及其学习中繁琐的人工特征工程过程，使得机器智能化程度进一步加深。但是深度学习想要发挥出理想的效果，需要大规模的数据，当数据量偏小时，学习效果较差。
[0003]深度学习想要从数据中学习出更有效的特征表示，一般会通过加深模型层数的方法，但这导致了深度学习模型的体积过大，无法部署在资源受限的设备上，往往只是理论上能达到最优，真正落地使用较为困难。
[0004]知识蒸馏是一种经典的模型压缩方法，核心思想是通过引导轻量化的学生模型“模仿”性能更好、结构更复杂的教师模型，在不改变学生模型结构的情况下提高其性能。
[0005]现有的知识蒸馏方法中，一般采用温度作为超参数的相对熵进行损失函数的设计，从而让学生模型通过学习分布间的差异性从而蒸馏到教师模型的知识。但是现有的蒸馏框架普遍会通过在验证集上的最优性能选择一个固定的温度系数。由此，产生以下问题：
[0006]其一、不同的教师模型和学生模型在蒸馏过程中，温度这个超参数的最优值不是唯一的。在知识蒸馏的不同阶段温度的最优值是不一样的。如果要找到这个最佳的超参数，需要进行暴力搜索，而暴力搜索会导致计算量显著增大，使模型运行效率降低。
[0007]其...

【技术保护点】

【技术特征摘要】
1.一种知识蒸馏的对抗式蒸馏温度调整方法，其特征在于，包括：获取教师模型、学生模型和温度参数；根据所述教师模型、所述学生模型和所述温度参数构建知识蒸馏的目标损失函数；根据梯度下降算法迭代更新所述学生模型的全体参数，以此更新所述学生模型，每一次迭代更新所述学生模型后，计算一次所述目标损失函数的值，直到所述目标损失函数的值最小，确定最小损失值；保持使得所述目标损失函数最小的所述全体参数不变，根据梯度上升算法迭代更新所述温度参数，每一次迭代更新所述温度参数后，计算一次所述目标损失函数的值，直到所述目标损失函数的值最大，确定最大损失值；确定所述最大损失值后，跳转到根据梯度下降算法迭代更新所述学生模型的全体参数的步骤重复执行，直到所述最大损失值与所述最小损失值之间差值的绝对值小于预设阈值，将所述绝对值小于预设阈值时对应的所述温度参数作为当前蒸馏温度。2.根据权利要求1所述的知识蒸馏的对抗式蒸馏温度调整方法，其特征在于，所述根据所述教师模型、所述学生模型和所述温度参数构建知识蒸馏的目标损失函数，包括：获取教师模型的第一损失函数；根据所述教师模型、所述学生模型和所述温度参数确定知识蒸馏的第二损失函数；根据所述第一损失函数和所述第二损失函数构建所述目标损失函数。3.根据权利要求2所述的知识蒸馏的对抗式蒸馏温度调整方法，其特征在于，所述根据所述教师模型、所述学生模型和所述温度参数确定知识蒸馏的第二损失函数，包括：获取模型输入样本集合；将所述模型输入样本集合中的任一样本分别输入所述教师模型和所述学生模型，分别得到第一教师模型输出向量和第一学生模型输出向量；根据所述第一教师模型输出向量确定教师模型概率向量，根据所述第一学生模型输出向量确定学生模型概率向量；计算所述教师模型概率向量和所述学生模型概率向量的第一相对熵；根据所述温度参数对所述第一相对熵进行放大或缩小，得到第二相对熵；根据所有所述模型输入样本集合中所有样本的所述第二相对熵，构建所述第二损失函数。4.根据权利要求3所述的知识蒸馏的对抗式蒸馏温度调整方法，其特征在于，所述根据所述第一教师模型输出向量确定教师模型概率向量，根据所述第一学生模型输出向量确定学生模型概率向量，包括：将所述第一教师模型输出向量除以所述温度参数，得到第二教师模型输出向量；将所述第一学生模型输出向量除以所述温度参数，得到第二学生模型输出向量；通过归一化指数函数将所述第二教师模型输出向量转换为教师模型概率向量；通过归一化指数函数将所述第二学生模型输出向量转换为学生模型概率向量。5.根据权利要求2所述的知识蒸馏的对抗式蒸馏温...

【专利技术属性】
技术研发人员：谯轶轩，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人