一种基于多阶段知识蒸馏的人体姿态估计方法、设备及存储介质技术

技术编号：44334802 阅读：12 留言：0更新日期：2025-02-18 20:44

本发明专利技术公开了一种基于多阶段知识蒸馏的人体姿态估计方法、设备及存储介质，属于计算机视觉技术领域，方法包括利用教师模型对学生模型进行训练，并利用训练后的学生模型进行人体姿态估计；在训练过程中，教师模型通过多阶段的知识蒸馏向学生模型转移知识；多阶段的知识蒸馏包括：中间层蒸馏为：在训练过程中，教师模型采用分层递进的蒸馏策略来指导学生模型的特征提取，输出层蒸馏为：在输出阶段，采用vanilla knowledge distillation蒸馏方法来调整学生模型的输出。本发明专利技术有效解决现有技术中教师与学生网络结构差异导致的语义不匹配问题，从而在不牺牲模型性能的前提下，显著提高轻量级网络在资源受限设备上的部署效率和准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机视觉，具体涉及一种基于多阶段知识蒸馏的人体姿态估计方法、设备及存储介质。

技术介绍

1、人体姿态估计技术是计算机视觉领域中的一项重要技术，广泛应用于行为分析、交互设计、增强现实等多个领域。现有的高精度人体姿态估计模型往往依赖于复杂的网络结构和大量的计算资源，这使得它们难以被部署在资源有限的移动设备上。传统的高精度人体姿态估计模型通常基于深度学习，特别是卷积神经网络(cnn)。这些模型如hrnet、openpose等，通过大量的网络层和复杂的架构实现了卓越的精度。然而，这些高精度模型通常需要大量的计算资源和存储空间，这限制了它们在计算能力有限的设备上的应用，如智能手机和嵌入式系统。为了在这类设备上部署人体姿态估计模型，研究者们探索了多种模型轻量化策略，包括网络剪枝、低秩分解、量化和知识蒸馏。这些方法虽然能够减轻模型负担，但往往以牺牲一定的性能为代价。知识蒸馏是一种有效的模型压缩技术，它通过从一个复杂的“教师”模型向一个简单的“学生”模型转移知识来提高学生模型的性能。在知识蒸馏过程中，学生模型学习模仿教师模型的输出或特征...

【技术保护点】

1.一种基于多阶段知识蒸馏的人体姿态估计方法，其特征在于，包括：

2.根据权利要求1所述的基于多阶段知识蒸馏的人体姿态估计方法，其特征在于，所述教师模型采用分层递进的蒸馏策略来指导学生模型的特征提取中，引入多感受野融合模块；所述多感受野融合模块结合多尺寸的卷积和池化操作。

3.根据权利要求1所述的基于多阶段知识蒸馏的人体姿态估计方法，其特征在于，在进行中间层蒸馏的过程中，使用1×1的卷积进行特征通道对齐，且当学生模型在本阶段特征提取过程中输出的特征图尺寸与教师模型在所有阶段输出的特征图尺寸不一致时，使用转置卷积调整学生模型在本阶段输出的特征图尺寸。

4...

【技术特征摘要】

1.一种基于多阶段知识蒸馏的人体姿态估计方法，其特征在于，包括：

4.根据权利要求1所述的基于多阶段知识蒸馏的人体姿态估计方法，其特征在于，所述教师模型采用分层递进的蒸馏策略来指导学生模型的特征提取中，还引入了交叉注意力权重分配模块，以获取中间层蒸馏损失；

5.根据权利要求1所述的基于多阶段知识蒸馏的人体姿态估计方法，其特征在于，学生模型输出的表示方法采用基于分类坐标的关键点表示方法；

6.根据权利要求5所述的基于...

【专利技术属性】
技术研发人员：冉旭，王云轩，周翔，徐浩，闫胜业，
申请(专利权)人：江苏源驶科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人