【技术实现步骤摘要】
本专利技术涉及计算机视觉领域,尤其涉及一种基于知识蒸馏技术的视觉模型压缩方法。
技术介绍
1、具身智能设备需要实时完成视觉感知任务,但其资源(如存储空间和计算能力)受限,传统的大型深度学习模型难以直接部署。因此,开发轻量化的模型压缩方法,既能满足具身智能设备的计算资源限制,又能保持高性能,成为当前技术发展的重要方向。
2、模型能够有效地从大型教师模型学习小型学生模型,它受到了社会越来越多的关注。知识蒸馏是典型的模型压缩技术,利用一个较大的模型(教师模型)的知识来训练一个较小的模型(学生模型),在保持模型性能的同时减小其规模,以适应边缘环境。知识蒸馏在计算机视觉领域得到了广泛的应用,尤其是在模型压缩和加速方面,其核心思想是通过将大型预训练模型(教师模型)中的知识传递给较小的模型(学生模型),从而提升学生模型的性能。
3、知识蒸馏作为一种模型压缩技术,最早于2015年提出。最初的研究通过引入软化的输出概率分布,使得学生模型能够更好地模仿教师模型的行为,从而在模型压缩中展现出明显的效果和应用前景。这一方法标志着知识蒸馏
...【技术保护点】
1.一种面向具身智能设备的视觉模型压缩方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种面向具身智能设备的视觉模型压缩方法,其特征在于:在步骤(5)中,通过函数计算概率分布时,使用温度参数来使概率分布平滑;教师模型输出的概率分布和学生模型输出的概率分布的具体计算公式分别为:
3.根据权利要求1所述的一种面向具身智能设备的视觉模型压缩方法,其特征在于:在步骤(6)中,响应损失的具体计算公式为:;其中,是分类任务的类别数,是教师模型输出的概率分布,是学生模型输出的概率分布。
4.根据权利要求1所述的一种面向具身智能设备的视觉
...【技术特征摘要】
1.一种面向具身智能设备的视觉模型压缩方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种面向具身智能设备的视觉模型压缩方法,其特征在于:在步骤(5)中,通过函数计算概率分布时,使用温度参数来使概率分布平滑;教师模型输出的概率分布和学生模型输出的概率分布的具体计算公式分别为:
3.根据权利要求1所述的一种面向具身智能设备的视觉模型压缩方法,其特征在于:在步骤(6)中,响应损失的具体计算公式为:;其中,是分类任务的类别数,是教师模型输出的概率分布,是学生模型输出的概率分布。
4.根据权利要求1所述的一种面向具身智能...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。