当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于知识蒸馏的人体解析方法与系统技术方案

技术编号:40837266 阅读:26 留言:0更新日期:2024-04-01 15:02
本发明专利技术公开了一种基于知识蒸馏的人体解析方法,包括:对人体图像和解析图像进行数据增强与处理,利用边缘编码器、姿态编码器、解析编码器和异构非局部模块分别生成边缘标签、姿态特征、粗略的解析特征和精细化解析特征,利用上述解析特征分别计算学生模型的总解析损失和蒸馏损失,二者共同构成了学生模型的整体损失函数,利用该整体损失函数对学生模型参数进行训练和优化,输出训练好的学生模型和最终的解析预测图像。本发明专利技术还公开了一种基于知识蒸馏的人体解析系统。本发明专利技术将知识蒸馏和人体解析加以结合,充分利用了人体解析任务特有的人体姿态、边缘等先验信息,利用知识蒸馏的方法在确保精确度的前提下最大限度地提升了模型的解析速度。

【技术实现步骤摘要】

本专利技术涉及计算机视觉,知识蒸馏和人体解析领域,具体涉及一种基于知识蒸馏的人体解析方法与系统


技术介绍

1、近年来,互联网技术高速发展,计算机视觉作为计算机理解现实世界的桥梁,深度学习相关技术的成功应用使得计算机视觉任务的性能得到大幅度提升,计算机视觉涉及多个具体研究领域和任务,其中语义分割同时解决了物体的分类和定位问题,能够识别问题的具体类型并准确定位物体的位置,属于像素级别的语义理解问题,是许多实际应用的核心技术。

2、在计算机视觉领域中,语义分割是计算机进行图像理解的重要基础,主要是对图像进行像素级分类,也就是对图像进行逐像素标注所属于一类别,其分割结果回对后续的图像处理任务产生直接影响。在实际应用场景中,以人为中心的图像分析处理成为了一个主流的研究方向。人体解析是一种细粒度人类语义分割,旨在对图像或视频中的人体部件和服装配件进行像素级分类,将人体划分成不同的语义部件,是以人为中心的视觉理解基本任务之一。由于人体解析在安全监控、自动驾驶、时尚分析、视觉特效、艺术创作等广泛应用领域发挥着至关重要的作用,人们对其进行了大量研究,催生了各种本文档来自技高网...

【技术保护点】

1.一种基于知识蒸馏的人体解析方法,其特征在于,所述方法包括:

2.如权利要求1所述的一种基于知识蒸馏的人体解析方法,其特征在于,所述将所述数据预处理后的人体解析数据集,构建结构相同、大小不同的教师模型和学生模型,包括利用边缘编码器、姿态编码器和解析编码器生成边缘特征、姿态特征和粗略的解析特征,之后采用异构非局部模块构造人体边缘特征、姿态特征和解析特征三者之间的相关性,利用边缘和姿态提供的关键上下文线索获得精细化解析特征,得到教师模型和学生模型的粗略解析特征、姿态特征、边缘特征、精细化解析特征、预测的像素类别概率、最终的解析预测结果,具体为:

3.如权利要求1所述...

【技术特征摘要】

1.一种基于知识蒸馏的人体解析方法,其特征在于,所述方法包括:

2.如权利要求1所述的一种基于知识蒸馏的人体解析方法,其特征在于,所述将所述数据预处理后的人体解析数据集,构建结构相同、大小不同的教师模型和学生模型,包括利用边缘编码器、姿态编码器和解析编码器生成边缘特征、姿态特征和粗略的解析特征,之后采用异构非局部模块构造人体边缘特征、姿态特征和解析特征三者之间的相关性,利用边缘和姿态提供的关键上下文线索获得精细化解析特征,得到教师模型和学生模型的粗略解析特征、姿态特征、边缘特征、精细化解析特征、预测的像素类别概率、最终的解析预测结果,具体为:

3.如权利要求1所述的一种基于知识蒸馏的人体解析方法,其特征在于,所述通过在所述真实的人体解析结果中的两个不同语义部分之间找到掩码的边界从而获得边缘标签,然后计算所述最终的解析预测结果与所述真实的人体解析结果、所述学生模型的粗略解析特征与所述真实的人体解析结果、所述学生模型的姿态特征与所述真实的人体姿态标签、所述学生模型的边缘特征与所述边缘标签的总解析损失,并记作学生模型的总解析损失,具体为:

4.如权利要求1所述的一种基于知识蒸馏的人体解析方法,其特征在于,所述计算所述教师模型和学生模型的预测的像素类别概率的蒸馏损失、所述教师模型和学生模型的粗略解析特征归一化蒸馏损失、所述教师模型和学生模型的姿态特征归一化蒸馏损失、所述教师模型和学生模型的边缘特征归一化蒸馏损失、所述教师模型和学生模型的精细化解析特征类内相似度蒸馏损失,从而组成由教师模型引导的学生模型的蒸馏损失,具体为:

...

【专利技术属性】
技术研发人员:周凡赖韵恬苏卓林谋广
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1