【技术实现步骤摘要】
基于深度知识迁移的人脸特征点检测方法、装置及设备
本专利技术实施例涉及计算机视觉和数字图像处理领域,具体涉及基于深度知识迁移的人脸特征点检测方法、装置及设备。
技术介绍
现有对人脸特征点检测的方法,对于自然场景下的人脸特征点定位不能有效的解决,复杂的方法模型参数量庞大,计算复杂度较高,无法满足运行速度的需求。简单的方法无法应对自然场景下极端姿态、多变光照、严重遮挡等因素的干扰,精度无法达到应用要求。
技术实现思路
本专利技术实施例的目的在于提供基于深度知识迁移的人脸特征点检测方法、装置及设备,用以解决现有人脸特征点检测计算复杂度较高、运行速度慢和精度低的问题。为实现上述目的,本专利技术实施例主要提供如下技术方案:第一方面,本专利技术实施例提供了一种基于深度知识迁移的人脸特征点检测方法,包括:S1:提供包含人脸特征点标注的人脸数据集,根据所述人脸数据集提供的人脸检测框或者人脸特征点的包围框对人脸图像进行裁剪得到训练集、验证集和测试集;S2:从所述训练集中获取训练样本,并从所述测试集中获取测试样本,将所述测试样本和所述训练样本输入到初始人脸对齐网络框架中;S3:设置卷积神经网络的参数,利用Pytorch训练所述初始人脸对齐网络框架中的教师网络和学生网络,直至损失函数和最大迭代次数满足预定条件时生成训练模型;S4:冻结教师网络的模型参数,提取所述教师网络学习的深层暗知识,将所述深层暗知识传递给所述学生网络,监督所述学生网络的训练过程生成最终人脸对齐网络模型 ...
【技术保护点】
1.一种基于深度知识迁移的人脸特征点检测方法,其特征在于,包括:/nS1:提供包含人脸特征点标注的人脸数据集,根据所述人脸数据集提供的人脸检测框或者人脸特征点的包围框对人脸图像进行裁剪得到训练集、验证集和测试集;/nS2:从所述训练集中获取训练样本,并从所述测试集中获取测试样本,将所述测试样本和所述训练样本输入到初始人脸对齐网络框架中;/nS3:设置卷积神经网络的参数,利用Pytorch训练所述初始人脸对齐网络框架中的教师网络和学生网络,直至损失函数和最大迭代次数满足预定条件时生成训练模型;/nS4:冻结教师网络的模型参数,提取所述教师网络学习的深层暗知识,将所述深层暗知识传递给所述学生网络,监督所述学生网络的训练过程生成最终人脸对齐网络模型;/nS5:将自然场景下的RGB人脸图像输入至所述最终人脸对齐网络模型中,输出人脸特征点检测结果。/n
【技术特征摘要】
1.一种基于深度知识迁移的人脸特征点检测方法,其特征在于,包括:
S1:提供包含人脸特征点标注的人脸数据集,根据所述人脸数据集提供的人脸检测框或者人脸特征点的包围框对人脸图像进行裁剪得到训练集、验证集和测试集;
S2:从所述训练集中获取训练样本,并从所述测试集中获取测试样本,将所述测试样本和所述训练样本输入到初始人脸对齐网络框架中;
S3:设置卷积神经网络的参数,利用Pytorch训练所述初始人脸对齐网络框架中的教师网络和学生网络,直至损失函数和最大迭代次数满足预定条件时生成训练模型;
S4:冻结教师网络的模型参数,提取所述教师网络学习的深层暗知识,将所述深层暗知识传递给所述学生网络,监督所述学生网络的训练过程生成最终人脸对齐网络模型;
S5:将自然场景下的RGB人脸图像输入至所述最终人脸对齐网络模型中,输出人脸特征点检测结果。
2.根据权利要求1所述的基于深度知识迁移的人脸特征点检测方法,其特征在于,步骤S1包括:
S1-1:提供WFLW数据集,所述WFLW数据集包括N张训练图片和M张测试图片,每张图片具有图片标签,所述图片信息包括人脸框信息、人脸特征点位置信息和多个属性信息,N和M均为大于零的正整数;
S1-2:根据所述人脸数据集提供的人脸检测框对人脸图像进行裁剪,同时对所述人脸检测框进行扰动,对所述人脸图像施加随机旋转、尺寸缩放和翻转,以进行数据增强得到所述训练集、所述验证集和所述测试集。
3.根据权利要求1所述的基于深度知识迁移的人脸特征点检测方法,其特征在于,通过以下方式生成所述初始人脸对齐网络框架:
采用编码器-解码器的网络结构生成所述教师网格,教师网格编码器包括三个上采样层与卷积层,所述教师网格编码器用于对输入图像进行特征提取和编码,保留原始网络的特征提取信息,移除最后的平均池化层、用来分类的全连接层和最后一个升维的1×1卷积层;
在所述编码器后添加所述解码器,对所述编码器提取的图像特征进行空间上采样得到特征图,将所述特征图的通道维数转换为人脸特征点的数量,使用空间softargmax运算在变换后的每张特征图上计算期望得到对应的人脸特征点坐标;
提供EfficientFAN结构的学生网络,学生网络编码器包括三个上采样层与卷积层,所述学生网络用于最终的人脸特征点检测,使用EfficientNet-B0作为所述学生网络编码器的主干部分,移除EfficientNet-B0最后的平均池化层、用来分类的全连接层和最后一个升维的1×1卷积层;
在所述学生网格编码器之后添加了一个1×1的卷积层,将所述学生网格编码器上采样得到特征图的通道数转换为人脸特征点的数目,使用空间softargmax运算在转换后的特征图上计算人脸特征点的坐标。
4.根据权利要求3所述的基于深度知识迁移的人脸特征点检测方...
【专利技术属性】
技术研发人员:吕科,高鹏程,薛健,
申请(专利权)人:中国科学院大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。