【技术实现步骤摘要】
本专利技术属于计算机视觉,具体涉及一种基于多阶段知识蒸馏的人体姿态估计方法、设备及存储介质。
技术介绍
1、人体姿态估计技术是计算机视觉领域中的一项重要技术,广泛应用于行为分析、交互设计、增强现实等多个领域。现有的高精度人体姿态估计模型往往依赖于复杂的网络结构和大量的计算资源,这使得它们难以被部署在资源有限的移动设备上。传统的高精度人体姿态估计模型通常基于深度学习,特别是卷积神经网络(cnn)。这些模型如hrnet、openpose等,通过大量的网络层和复杂的架构实现了卓越的精度。然而,这些高精度模型通常需要大量的计算资源和存储空间,这限制了它们在计算能力有限的设备上的应用,如智能手机和嵌入式系统。为了在这类设备上部署人体姿态估计模型,研究者们探索了多种模型轻量化策略,包括网络剪枝、低秩分解、量化和知识蒸馏。这些方法虽然能够减轻模型负担,但往往以牺牲一定的性能为代价。知识蒸馏是一种有效的模型压缩技术,它通过从一个复杂的“教师”模型向一个简单的“学生”模型转移知识来提高学生模型的性能。在知识蒸馏过程中,学生模型学习模仿教师模型的输出或特征
...【技术保护点】
1.一种基于多阶段知识蒸馏的人体姿态估计方法,其特征在于,包括:
2.根据权利要求1所述的基于多阶段知识蒸馏的人体姿态估计方法,其特征在于,所述教师模型采用分层递进的蒸馏策略来指导学生模型的特征提取中,引入多感受野融合模块;所述多感受野融合模块结合多尺寸的卷积和池化操作。
3.根据权利要求1所述的基于多阶段知识蒸馏的人体姿态估计方法,其特征在于,在进行中间层蒸馏的过程中,使用1×1的卷积进行特征通道对齐,且当学生模型在本阶段特征提取过程中输出的特征图尺寸与教师模型在所有阶段输出的特征图尺寸不一致时,使用转置卷积调整学生模型在本阶段输出的特征图尺
4...
【技术特征摘要】
1.一种基于多阶段知识蒸馏的人体姿态估计方法,其特征在于,包括:
2.根据权利要求1所述的基于多阶段知识蒸馏的人体姿态估计方法,其特征在于,所述教师模型采用分层递进的蒸馏策略来指导学生模型的特征提取中,引入多感受野融合模块;所述多感受野融合模块结合多尺寸的卷积和池化操作。
3.根据权利要求1所述的基于多阶段知识蒸馏的人体姿态估计方法,其特征在于,在进行中间层蒸馏的过程中,使用1×1的卷积进行特征通道对齐,且当学生模型在本阶段特征提取过程中输出的特征图尺寸与教师模型在所有阶段输出的特征图尺寸不一致时,使用转置卷积调整学生模型在本阶段输出的特征图尺寸。
4.根据权利要求1所述的基于多阶段知识蒸馏的人体姿态估计方法,其特征在于,所述教师模型采用分层递进的蒸馏策略来指导学生模型的特征提取中,还引入了交叉注意力权重分配模块,以获取中间层蒸馏损失;
5.根据权利要求1所述的基于多阶段知识蒸馏的人体姿态估计方法,其特征在于,学生模型输出的表示方法采用基于分类坐标的关键点表示方法;
6.根据权利要求5所述的基于...
【专利技术属性】
技术研发人员:冉旭,王云轩,周翔,徐浩,闫胜业,
申请(专利权)人:江苏源驶科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。