人脸识别模型构建方法、人脸识别方法及相关装置制造方法及图纸

技术编号:24458063 阅读:56 留言:0更新日期:2020-06-10 16:09
本申请实施例公开了一种人脸识别模型构建方法、人脸识别方法及相关装置,方法包括:根据预先训练好的N个人脸识别教师模型和样本数子集更新原始类中心矩阵,得到更新后的N个原始类中心矩阵;获取当前训练周期的N个特征空间转换矩阵;根据N个特征空间转换矩阵和N个原始类中心矩阵,确定融合类中心矩阵;根据融合类中心矩阵和预设的监督损失函数对当前训练的人脸识别学生模型进行训练,得到训练后的人脸识别学生模型;若训练后的人脸识别学生模型满足预设条件,则确定当前训练的人脸识别学生模型收敛;若训练后的人脸识别学生模型不满足预设条件,则继续下一个训练周期,直至满足预设条件。本申请有利于提高人脸学生识别模型的效率和准确度。

Face recognition model building method, face recognition method and related devices

【技术实现步骤摘要】
人脸识别模型构建方法、人脸识别方法及相关装置
本申请涉及人脸识别
,具体涉及一种人脸识别模型构建方法、人脸识别方法及相关装置。
技术介绍
如今,随着人工智能技术的飞速发展,人脸识别已经成为一种重要的人机交互方式,被广泛地应用于安防监控、智能支付、社交媒体、医疗等领域。然而,为了获得较高的人脸识别精度,通常采用结构复杂且参数量较多的神经网络,最终导致训练完成的人脸识别模型在计算资源有限的移动端或嵌入式设备上难以使用。因此,如何训练出速度快、精度高的人脸识别模型是人脸识别领域亟待解决的一个问题。
技术实现思路
本申请实施例提供了一种人脸识别模型构建方法、人脸识别方法及相关装置,以期提高人脸学生识别模型的效率和准确度。第一方面,本申请实施例提供一种人脸识别模型构建方法,包括:根据预先训练好的N个人脸识别教师模型中每个人脸识别教师模型和当前训练周期所需要处理的样本数子集更新原始类中心矩阵,得到更新后的N个原始类中心矩阵,N为大于1的整数;获取当前训练周期所述N个人脸识别教师模型针对当前训练的人脸识别学生模型的N个特征空间转换矩阵;根据所述N个特征空间转换矩阵和所述N个原始类中心矩阵,确定融合类中心矩阵;根据所述融合类中心矩阵和预设的监督损失函数对当前训练的人脸识别学生模型进行训练,得到当前训练周期训练后的人脸识别学生模型,所述监督损失函数至少包括根据所述融合类中心矩阵设计的蒸馏监督损失函数;若当前训练周期训练后的人脸识别学生模型满足预设条件,则确定所述当前训练的人脸识别学生模型收敛;若当前训练周期训练后的人脸识别学生模型不满足所述预设条件,则继续下一个训练周期,直至满足所述预设条件。可以看出,本申请实施例中,人脸识别模型构建设备首先根据预先训练好的N个人脸识别教师模型中每个人脸识别教师模型和当前训练周期所需要处理的样本数子集更新原始类中心矩阵,得到更新后的N个原始类中心矩阵,其次,获取当前训练周期N个人脸识别教师模型针对当前训练的人脸识别学生模型的N个特征空间转换矩阵,再次,根据N个特征空间转换矩阵和N个原始类中心矩阵,确定融合类中心矩阵,然后根据该融合类中心矩阵和预设的监督损失函数对当前训练的人脸识别学生模型进行训练,得到当前训练周期训练后的人脸识别学生模型,若当前训练周期训练后的人脸识别学生模型满足预设条件,则确定当前训练的人脸识别学生模型收敛;若当前训练周期训练后的人脸识别学生模型不满足预设条件,则继续下一个训练周期,直至满足预设条件。由于上述该监督损失函数至少包括根据融合类中心矩阵设计的蒸馏监督损失函数,一方面这使得对于同一类的样本,都是让其向同一个类中心向量逼近,从而使得类内距离足够小,二方面类中心向量相对单个样本的特征更加具有区分性和表示性,能够使得学生模型学习到更加可靠的类别特征向量,可以在一定程度上抵消类内难例样本带来的影响,从而传递给学生模型更可靠的蒸馏信息,提高人脸识别学生模型的效率和准确度。第二方面,本申请实施例提供一种人脸识别方法,包括:在检测到人脸识别请求后,采集用户的目标人脸数据;调用预先训练好的目标人脸识别学生模型;将所述目标人脸数据输入所述目标人脸识别学生模型,得到人脸识别结果;其中,所述目标人脸识别学生模型是如第一方面人脸识别模型构建方法所构建的人脸识别学生模型中的人脸识别模型。可以看出,本申请实施例中,相对于目前采用单个教师模型指导单个学生模型,如果只是单纯地选择一个精度最高的模型作为教师模型,可能会由于教师模型和学生模型之间的差异性较大,无法带来很好的蒸馏效果,所以选择出一个有效的教师模型是费时费力的;其次,单个学生模型最终只能获得单个轻量级人脸识别模型,而不同的嵌入式设备其性能不同,对模型的速度和精度要求也不同,所以单个模型其局限性较大,本申请通过使用多个教师模型进行知识蒸馏,可以选择任意特征维度的教师模型和学生模型进行匹配,从而避免部分教师模型无法直接使用的情况,通过提高学生模型训练全面性,从而提高人脸识别学生模型的应用性能。第三方面,本申请实施例提供一种人脸识别模型构建装置,包括处理单元和通信单元,其中,所述处理单元,用于根据预先训练好的N个人脸识别教师模型中每个人脸识别教师模型和当前训练周期所需要处理的样本数子集更新原始类中心矩阵,得到更新后的N个原始类中心矩阵,N为大于1的整数;以及用于通过所述通信单元获取当前训练周期所述N个人脸识别教师模型针对当前训练的人脸识别学生模型的N个特征空间转换矩阵;以及用于根据所述N个特征空间转换矩阵和所述N个原始类中心矩阵,确定融合类中心矩阵;以及用于根据所述融合类中心矩阵和预设的监督损失函数对当前训练的人脸识别学生模型进行训练,得到当前训练周期训练后的人脸识别学生模型,所述监督损失函数至少包括根据所述融合类中心矩阵设计的蒸馏监督损失函数;以及用于若当前训练周期训练后的人脸识别学生模型满足预设条件,则确定所述当前训练的人脸识别学生模型收敛;以及用于若当前训练周期训练后的人脸识别学生模型不满足所述预设条件,则继续下一个训练周期,直至满足所述预设条件。第四方面,本申请实施例提供一种人脸识别装置,包括处理单元和通信单元,其中,所述处理单元,用于在检测到人脸识别请求后,采集用户的目标人脸数据;以及用于调用预先训练好的目标人脸识别学生模型;以及用于通过所述通信单元将所述目标人脸数据输入所述目标人脸识别学生模型,得到人脸识别结果;其中,所述目标人脸识别学生模型是如第三方面所述的人脸识别模型构建装置所构建的人脸识别学生模型中的人脸识别模型。第五方面,本申请实施例提供一种人脸识别模型构建设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面任一方法中的步骤的指令。第六方面,本申请实施例提供一种人脸识别设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第二方面任一方法中的步骤的指令。第七方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面或第二方面任一方法中所描述的部分或全部步骤。第八方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面或第二方面任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出本文档来自技高网...

【技术保护点】
1.一种人脸识别模型构建方法,其特征在于,包括:/n根据预先训练好的N个人脸识别教师模型中每个人脸识别教师模型和当前训练周期所需要处理的样本数子集更新原始类中心矩阵,得到更新后的N个原始类中心矩阵,N为大于1的整数;/n获取当前训练周期所述N个人脸识别教师模型针对当前训练的人脸识别学生模型的N个特征空间转换矩阵;/n根据所述N个特征空间转换矩阵和所述N个原始类中心矩阵,确定融合类中心矩阵;/n根据所述融合类中心矩阵和预设的监督损失函数对当前训练的人脸识别学生模型进行训练,得到当前训练周期训练后的人脸识别学生模型,所述监督损失函数至少包括根据所述融合类中心矩阵设计的蒸馏监督损失函数;/n若当前训练周期训练后的人脸识别学生模型满足预设条件,则确定所述当前训练的人脸识别学生模型收敛;/n若当前训练周期训练后的人脸识别学生模型不满足所述预设条件,则继续下一个训练周期,直至满足所述预设条件。/n

【技术特征摘要】
1.一种人脸识别模型构建方法,其特征在于,包括:
根据预先训练好的N个人脸识别教师模型中每个人脸识别教师模型和当前训练周期所需要处理的样本数子集更新原始类中心矩阵,得到更新后的N个原始类中心矩阵,N为大于1的整数;
获取当前训练周期所述N个人脸识别教师模型针对当前训练的人脸识别学生模型的N个特征空间转换矩阵;
根据所述N个特征空间转换矩阵和所述N个原始类中心矩阵,确定融合类中心矩阵;
根据所述融合类中心矩阵和预设的监督损失函数对当前训练的人脸识别学生模型进行训练,得到当前训练周期训练后的人脸识别学生模型,所述监督损失函数至少包括根据所述融合类中心矩阵设计的蒸馏监督损失函数;
若当前训练周期训练后的人脸识别学生模型满足预设条件,则确定所述当前训练的人脸识别学生模型收敛;
若当前训练周期训练后的人脸识别学生模型不满足所述预设条件,则继续下一个训练周期,直至满足所述预设条件。


2.根据权利要求1所述的方法,其特征在于,所述根据所述N个特征空间转换矩阵和所述N个原始类中心矩阵,确定融合类中心矩阵,包括:
根据所述N个特征空间转换矩阵和所述N个原始类中心矩阵,将所述N个人脸识别教师模型的特征投影到当前训练的人脸识别学生模型的特征所在的空间,得到N个第一类中心矩阵;
根据所述N个第一类中心矩阵确定所述融合类中心矩阵。


3.根据权利要求1或2所述的方法,其特征在于,所述根据所述每个人脸识别教师模型和当前训练周期所需要处理的样本数子集更新原始类中心矩阵之前,所述方法还包括:
设置预设训练好的的N个人脸识别教师模型中每个人脸识别教师模型的学习率为0,所述人脸识别教师模型的复杂度高于所述人脸识别学生模型的复杂度。


4.根据权利要求3所述的方法,其特征在于,所述若当前训练周期训练后的人脸识别学生模型不满足所述预设条件,所述方法还包括:
针对所述N个特征空间转换矩阵执行如下更新操作,得到更新后的N个特征空间转换矩阵:
利用所述融合类中心矩阵、当前训练周期所需要处理的样本数据子集经过当前处理的人脸识别学生模型得到的特征向量矩阵、以及当前训练周期所需要处理的样本数据子集经过当前处理的人脸识别教师模型得到的J个人脸类别的类中心矩阵,更新所述当前处理的人脸识别教师模型的特征空间转换矩阵,得到更新后的特征空间转换矩阵。


5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
获取人脸样本数据集;
划分所述人脸样本数据集为多个样本数据子集。


6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
统计分析所述人脸样本数据集得到J个人脸类别,J为正整数;
选取和训练所述N个人脸识别教师模型;
针对所述每个人脸识别教师模型,设置每个人脸类别的初始类中心向量为预设向量,得到所述每个人脸识别教师模型的初始类中心矩阵,所述预设向量的维度等于当前设置的初始类中心矩阵对应的人脸识别教师模型输出的人脸特征向量的维度;

【专利技术属性】
技术研发人员:奚昌凤沙文吴子扬李啸陆磊
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1