人脸识别模型建立方法、人脸识别方法和电子设备技术

技术编号:37160304 阅读:24 留言:0更新日期:2023-04-06 22:24
本发明专利技术提供一种人脸识别模型建立方法、人脸识别方法和电子设备。该方法包括:构建初始学生网络模型;将训练图像集进行分组后,逐组输入所述初始学生网络模型和预训练的教师网络模型,输出得到多组相互对应的学生网络特征向量集合和教师网络特征向量集合;针对每个学生网络特征向量和每个教师网络特征向量,分别计算与各类别特征向量之间的余弦相似度,对余弦相似度进行分组;分别根据对应的余弦相似度的分组结果对初始损失函数进行解耦和筛选,根据的筛选结果对初始学生网络的参数进行优化,完成一次优化迭代过程;重复上述步骤,直至得到收敛的学生网络模型,作为人脸识别模型。该方法降低了知识蒸馏的难度,且得到的人脸识别模型性能较好。模型性能较好。模型性能较好。

【技术实现步骤摘要】
人脸识别模型建立方法、人脸识别方法和电子设备


[0001]本专利技术涉及人脸识别
,尤其涉及一种人脸识别模型建立方法、人脸识别方法和电子设备。

技术介绍

[0002]由于大量的数据驱动与优秀模型算法的提出,使得人脸识别可以达到非常高的精准率,但是识别性能更好的模型通常要求更大的模型规模。随着移动设备的普及,对具有分辨力的轻量级模型有着极大的需求。
[0003]传统知识蒸馏技术旨在利用具有良好识别性能的大规模的模型(教师网络)指导更轻量级的模型(学生网络)的训练,传统的知识蒸馏方法主要分为基于特征蒸馏与基于概率输出蒸馏。
[0004]然而特征蒸馏通常需要保持学生网络与教师网络的网络输出特征维度一致,灵活性较低;基于概率输出的蒸馏不需要保持一致的特征维度,但由于人脸识别模型训练的身份类数较大,相应地增大了蒸馏任务的难度,使得蒸馏任务的可行性较低,且由于轻量的学生网络的建模能力有限,难以缩小与教师网络之间巨大的性能差距,得到的学生网络的性能较差。

技术实现思路

[0005]本专利技术提供一种人脸识别模型建立方法、人脸识别方法和电子设备,用以解决现有技术中的通过知识蒸馏技术获得学生网络时,灵活性较低、蒸馏任务难度较大、得到的学生网络性能较差的缺陷,实现一种灵活性较高,蒸馏任务难度小,得到的学生网络性能较好的基于知识蒸馏的人脸识别模型建立方法。
[0006]本专利技术提供一种人脸识别模型建立方法,包括:
[0007]构建初始学生网络模型;
[0008]将训练图像集进行分组后,逐组输入所述初始学生网络模型和预训练的教师网络模型,输出得到多组相互对应的学生网络特征向量集合和教师网络特征向量集合;
[0009]针对每组相互对应的所述学生网络特征向量集合和所述教师网络特征向量集合中的每个学生网络特征向量和每个教师网络特征向量,分别通过全连接分类网络计算与各类别特征向量之间的余弦相似度,并分别对每个学生网络特征向量和每个教师网络特征向量对应的余弦相似度进行分组;
[0010]基于每组相互对应的所述学生网络特征向量集合和所述教师网络特征向量集合,分别根据对应的余弦相似度的分组结果对初始损失函数进行解耦和筛选,根据每组的筛选结果分别对所述初始学生网络的参数进行优化,完成一次优化迭代过程;
[0011]重复上述步骤,对构建的初始学生网络模型进行多次优化迭代过程,直至所述初始学生网络模型收敛得到学生网络模型,将所述学生网络模型作为人脸识别模型。
[0012]根据本专利技术提供的一种人脸识别模型建立方法,所述将训练图像集进行分组后,
逐组输入所述初始学生网络模型和预训练的教师网络模型,输出得到多组相互对应的学生网络特征向量集合和教师网络特征向量集合,包括:
[0013]将所述训练图像集划分为N个子训练集;
[0014]将第1个子训练集同时输入所述初始学生网络模型和预训练的所述教师网络模型,输出得到相互对应的第1学生网络特征向量集合和第1教师网络特征向量集合;
[0015]重复上述步骤,直至将第N个子训练集同时输入所述初始学生网络模型和预训练的所述教师网络模型,输出得到相互对应的第N学生网络特征向量集合和第N教师网络特征向量集合。
[0016]根据本专利技术提供的一种人脸识别模型建立方法,所述针对每组相互对应的所述学生网络特征向量集合和所述教师网络特征向量集合中的每个学生网络特征向量和每个教师网络特征向量,通过全连接分类网络分别计算与各类别特征向量之间的余弦相似度,并分别对每个学生网络特征向量和每个教师网络特征向量对应的余弦相似度进行分组,包括:
[0017]针对每组相互对应的所述学生网络特征向量集合和所述教师网络特征向量集合中的每个学生网络特征向量和每个教师网络特征向量,通过所述全连接分类网络分别计算与各类别特征向量之间的余弦相似度,得到多个学生余弦相似度集合和多个教师余弦相似度集合;
[0018]分别计算每个所述学生余弦相似度集合中的各学生余弦相似度和每个所述教师余弦相似度集合中的各教师余弦相似度的概率输出值;
[0019]基于每个所述学生余弦相似度集合对应的所述概率输出值分别将各所述学生余弦相似度集合中的学生余弦相似度分为主要知识组和次要知识组;
[0020]基于每个所述学生余弦相似度集合对应的所述概率输出值分别将对应的所述教师余弦相似度集合中的教师余弦相似度分为主要知识组和次要知识组。
[0021]根据本专利技术提供的一种人脸识别模型建立方法,所述基于每组相互对应的所述学生网络特征向量集合和所述教师网络特征向量集合,分别根据对应的余弦相似度的分组结果对初始损失函数进行解耦和筛选,根据每组的筛选结果分别对所述初始学生网络的参数进行优化,完成一次优化迭代过程,包括:
[0022]针对一组相互对应的所述学生网络特征向量集合和所述教师网络特征向量集合,得到多组相互对应的学生特征向量和教师特征向量;
[0023]根据每组相互对应的学生特征向量和教师特征向量分别对应的余弦相似度的分组结果对初始损失函数进行解耦处理,获得多组解耦结果;
[0024]分别对多组所述解耦结果进行筛选,获得目标蒸馏损失,并根据所述目标蒸馏损失对所述初始学生网络模型的参数进行一次优化;
[0025]重复上述步骤,直到基于多组相互对应的所述学生网络特征向量集合和所述教师网络特征向量集合计算了多个目标蒸馏损失,并根据多个所述目标蒸馏损失对所述初始学生网络模型的参数进行了多次优化,完成一次优化迭代过程。
[0026]根据本专利技术提供的一种人脸识别模型建立方法,每组所述解耦结果均包括主要知识蒸馏损失、次要知识蒸馏损失和知识分布蒸馏损失;
[0027]所述分别对多组所述解耦结果进行筛选,获得目标蒸馏损失,并根据所述目标蒸
馏损失对所述初始学生网络模型的参数进行一次优化,包括:
[0028]分别对多组所述解耦结果进行筛选,筛除每组解耦结果中的所述次要知识蒸馏损失,获得对应多组所述解耦结果的多个初始蒸馏损失;
[0029]对多个初始蒸馏损失进行平均化处理得到目标蒸馏损失;
[0030]根据所述目标蒸馏损失对所述初始学生网络模型的参数进行一次优化。
[0031]根据本专利技术提供的一种人脸识别模型建立方法,所述构建初始学生网络模型之前或之后,还包括:
[0032]建立初始训练图像集,并对所述初始训练图像集中的图像进行预处理得到训练图像集。
[0033]本专利技术还提供一种人脸识别方法,使用上述任一种所述的人脸识别模型建立方法建立的人脸识别模型进行识别;
[0034]所述人脸识别方法包括:
[0035]采集人脸图像并对所述人脸图像进行预处理;
[0036]将所述预处理后的所述人脸图像输入所述人脸识别模型,输出得到对应所述人脸图像的人脸特征向量;
[0037]计算所述人脸特征向量与各类别特征向量之间的余弦相似度;
[0038]根据计算获得的余弦相似度,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人脸识别模型建立方法,其特征在于,包括:构建初始学生网络模型;将训练图像集进行分组后,逐组输入所述初始学生网络模型和预训练的教师网络模型,输出得到多组相互对应的学生网络特征向量集合和教师网络特征向量集合;针对每组相互对应的所述学生网络特征向量集合和所述教师网络特征向量集合中的每个学生网络特征向量和每个教师网络特征向量,通过全连接分类网络分别计算与各类别特征向量之间的余弦相似度,并分别对每个学生网络特征向量和每个教师网络特征向量对应的余弦相似度进行分组;基于每组相互对应的所述学生网络特征向量集合和所述教师网络特征向量集合,分别根据对应的余弦相似度的分组结果对初始损失函数进行解耦和筛选,根据每组的筛选结果分别对所述初始学生网络的参数进行优化,完成一次优化迭代过程;重复上述步骤,对构建的初始学生网络模型进行多次优化迭代过程,直至所述初始学生网络模型收敛得到学生网络模型,将所述学生网络模型作为人脸识别模型。2.根据权利要求1所述的人脸识别模型建立方法,其特征在于,所述将训练图像集进行分组后,逐组输入所述初始学生网络模型和预训练的教师网络模型,输出得到多组相互对应的学生网络特征向量集合和教师网络特征向量集合,包括:将所述训练图像集划分为N个子训练集;将第1个子训练集同时输入所述初始学生网络模型和预训练的所述教师网络模型,输出得到相互对应的第1学生网络特征向量集合和第1教师网络特征向量集合;重复上述步骤,直至将第N个子训练集同时输入所述初始学生网络模型和预训练的所述教师网络模型,输出得到相互对应的第N学生网络特征向量集合和第N教师网络特征向量集合。3.根据权利要求1所述的人脸识别模型建立方法,其特征在于,所述针对每组相互对应的所述学生网络特征向量集合和所述教师网络特征向量集合中的每个学生网络特征向量和每个教师网络特征向量,通过全连接分类网络分别计算与各类别特征向量之间的余弦相似度,并分别对每个学生网络特征向量和每个教师网络特征向量对应的余弦相似度进行分组,包括:针对每组相互对应的所述学生网络特征向量集合和所述教师网络特征向量集合中的每个学生网络特征向量和每个教师网络特征向量,通过所述全连接分类网络分别计算与各类别特征向量之间的余弦相似度,得到多个学生余弦相似度集合和多个教师余弦相似度集合;分别计算每个所述学生余弦相似度集合中的各学生余弦相似度和每个所述教师余弦相似度集合中的各教师余弦相似度的概率输出值;基于每个所述学生余弦相似度集合对应的所述概率输出值分别将各所述学生余弦相似度集合中的学生余弦相似度分为主要知识组和次要知识组;基于每个所述学生余弦相似度集合对应的所述概率输出值分别将对应的所述教师余弦相似度集合中的教师余弦相似度分为主要知识组和次要知识组。4.根据权利要求1所述的人脸识别模型建立方法,其特征在于...

【专利技术属性】
技术研发人员:朱翔昱雷震张晓宇赵唯松
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1