当前位置: 首页 > 专利查询>厦门大学专利>正文

基于教师微调的量化感知蒸馏方法及装置制造方法及图纸

技术编号:41232669 阅读:18 留言:0更新日期:2024-05-09 23:48
本发明专利技术公开了一种基于教师微调的量化感知蒸馏方法及装置,其中方法包括:将训练数据集输入到伪学生模型进行梯度更新,以得到更新后的伪学生模型;将查询集输入到更新后的伪学生模型,以得到分类损失,以便通过分类损失对教师模型进行梯度更新,以得到微调后的教师模型;将训练数据集输入到学生网络模块和微调后的教师模型以得到对应的第一输出结果和第二输出结果,以及根据第一输出结果和第二输出结果得到余弦相识度,并根据余弦相识度得到最终的损失函数,以便根据最终的损失函数对学生网络模块进行更新;从而缩小全精度教师模型和低精度学生模型之间的性能差距,并提高蒸馏效果。

【技术实现步骤摘要】

本专利技术涉及图像识别,特别涉及一种基于教师微调的量化感知蒸馏方法、一种计算机可读存储介质、一种计算机设备以及一种基于教师微调的量化感知蒸馏装置。


技术介绍

1、在过去的十年里,深度学习经历了飞速的发展,并在各种下游任务中展现出了卓越的性能;无论是图像分类、语音识别还是自然语言处理,深度学习都为我们提供了强大的工具,使得机器能够更好地理解和处理复杂的任务;然而,随着计算资源的限制和边缘设备的普及,深度学习的轻量化成为了迫切需要解决的问题;深度模型轻量化是指在保持模型性能的同时,降低模型的计算复杂度和存储需求,使得深度模型可以在资源受限的边缘计算设备上也能够高效运行;为了实现这一目标,研究者们提出了各种方法,其中包括剪枝、量化和知识蒸馏等;剪枝是一种通过去除模型中的冗余信息来减小模型大小和计算复杂度的方法;它通过对网络进行剪枝操作,去掉一些对输出影响较小的神经元或者连接,从而减少模型的计算量和存储需求;量化是一种将模型中的高精度参数转化为低精度参数的方法,通过对模型进行量化,可以大大减少模型的存储需求,同时保持模型性能的稳定;知识蒸馏是一种将大模型的知识迁移本文档来自技高网...

【技术保护点】

1.一种基于教师微调的量化感知蒸馏方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于教师微调的量化感知蒸馏方法,其特征在于,根据以下公式对所述教师模型进行梯度更新:

3.如权利要求2所述的基于教师微调的量化感知蒸馏方法,其特征在于,根据以下公式得到余弦相识度:

4.如权利要求3所述的基于教师微调的量化感知蒸馏方法,其特征在于,根据以下公式得到最终的损失函数:

5.一种计算机可读存储介质,其特征在于,其上存储有基于教师微调的量化感知蒸馏程序,该基于教师微调的量化感知蒸馏程序被处理器执行时实现如权利要求1-4中任一项所述的基于教师微调...

【技术特征摘要】

1.一种基于教师微调的量化感知蒸馏方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于教师微调的量化感知蒸馏方法,其特征在于,根据以下公式对所述教师模型进行梯度更新:

3.如权利要求2所述的基于教师微调的量化感知蒸馏方法,其特征在于,根据以下公式得到余弦相识度:

4.如权利要求3所述的基于教师微调的量化感知蒸馏方法,其特征在于,根据以下公式得到最终的损失函数:

5.一种计算机可读存储介质,其特征在于,其上存储有基于教师微调的量化感知蒸馏程序,该基于教师微调的量化感知蒸馏程序被处理器执行时实现如权利要求1-4中任一项所述的基于教师微调的量化感知蒸馏方法。<...

【专利技术属性】
技术研发人员:涂晓彤刘奕阳康元勋丁兴号黄悦袁飞朱逸
申请(专利权)人:厦门大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1